﻿(a^, ,a^) pentru (minS - maxjD)/ și maxT , -> , -> , -> și adăugând sau excluzând zerouri de început Deoarece operațiile de compresie nu măresc numărul de cifre diferite de zero, an conține cel mai mic număr [Advances in Computers ( ), - ] Numărul î'(n) al cifrelor diferite de zero într-un este numărul de unități din reprezentarea obișnuită imediat precedat fie de zero, fie de subșirul ( )fc pentru unele k > O generalizare pentru sistemele de reprezentare la baza b > este propusă de J von zur Gathen, Computațional Complexity ( ), - SECȚIUNEA A" \u d ( , + ); h \u d ( , + ) Rețineți că valoarea YL ar arăta ca ( , + ) ) E-'( - b~p), b~ch~p; LE~CH( - b~p), b- " Dacă e nu își ia cea mai mică valoare, atunci cea mai semnificativă cifră, în care toate aceste numere normalizate conțin unul, nu poate fi inclusă în cuvântul mașină (adică, nu este stocată, dar implicită atunci când se efectuează operațiuni) ( ,+ ); ( ,+ ); ( ,+ ) Dacă primul operand ar fi ( , - ), atunci al treilea răspuns ar fi ( , + ), deoarece b/ este impar Dacă x ~ y și m este un număr întreg, atunci mb + x ~ mb + y Mai mult, dacă luăm în considerare toate cazurile posibile, rezultă că din x ~ y rezultă m/ ~ y/b O altă proprietate importantă este că x și y vor fi rotunjite la același număr întreg pentru orice x ~ y Acum, dacă b~p~ Fv fv, este necesar să se obțină (bp+ fv) mod b Prin urmare, transformarea lasă fv neschimbată atâta timp cât eu - ev > Deoarece u nu este normalizat, este diferit de zero și \fu + AI > - b~ > b~ Bitul principal diferit de zero fu + fv nu trebuie să fie mai mult de doi biți la dreapta punctului de separare, iar operația de rotunjire transformă bp + j ( fu + A) într-un număr întreg unde j ) Din paragraful anterior, avem bp+ (fu + fv) ~ bp+ fu + Fv = bp+ (fu + b~p~ Fv), ceea ce implică rezultatul necesar pentru tot j este par, un astfel de număr întreg Fv există întotdeauna; dar dacă = , ar fi necesari p + biți (presupunând că FV este un număr întreg) Dacă b este impar, atunci întregul Fv există întotdeauna, cu excepția cazului divizării în algoritmul M, când restul | este posibil (Luați în considerare cazul în care eu = ev, fu = -fv, în programul A ) Registrul A va păstra valoarea semnului anterioară, așa cum a făcut-o când a fost executată instrucțiunea ADD Vom spune că un număr este normalizat dacă și numai dacă este egal cu zero sau partea lui fracțională este în intervalul | |d|, apoi setați r ] - ) [rX acceptă cifre diferite de zero])?/, unde N este numărul de deplasări la stânga în timpul normalizării Timpul maxim de m se obține dacă, de exemplu, și = + , ѵ = - , b = [Având în vedere datele din secțiunea , timpul va fi de ordinul a , m ] SECȚIUNEA și QV \u d și (r) - ѵ \u d - V (r)i \u d - (y (r) -u) \u d - (y Ѳ și) ifx > mfO = și, după cum urmează din ( ), ( ), ( ), deci din nou în virtutea ( ) (u(r)a:)(r)t> > mfv În mod similar, din ( ) și ( ) împreună cu ( ) rezultă că (u φ r) φ (y φ y) > (u φ x) ϵ v u = , , ѵ = , , w = , ; (și (r) v) (r) w = , și (r) (y (r) w) = , Da; fie /u " v - w, unde v este mare Nu întotdeauna, de exemplu pentru numere și = ѵ = în sistemul zecimal (a) Da (b) Numai pentru b+p ,~ ,beu,~ ) și ai > |, obținem ( ai ap-iap)b (r) ( )b = ( ai ap-i(ap - )) b; aici " " este b - În plus, ( ai ap iap)b (r) ( )b = (ai • • • ap-i )b, deci dacă b > și ap > + [ai>|], înmulțirea se dovedește a fi o operație nemonotonă Dar în cazul în care = , folosind același raționament, se poate demonstra că înmulțirea este monotonă Evident, "un computer" are b > Se poate presupune, fără pierderi de generalitate, că x este un număr întreg, p, atunci x - t = [Rezultatul este valabil și pentru o premisă inițială mai slabă |t| p ] Să presupunem că eu = p, ev Cazul : u > bp~ Cazul ( , a): w = w + , v > ~, ev = Atunci u = u sau u + , v = , u" = u, v" = sau Cazul ( , b): w = u, |v| еѵ = , ca în w = u, |v| u, ca în ( , b) Cazul ( , c): w = u, |v| u' = u - j/b, unde ѵ = j/b + ѵi și |tn| r Prin urmare, răspunsul este următorul: trebuie să cerem ca condițiile |m| există numere ѵ / w astfel încât ѵ φ ѵ = w φ w Aceasta înseamnă că condiția formulată în problemă nu este îndeplinită [Pe de altă parte, formula u φ ((ѵ (c) u) ) oferă un punct de mijloc situat în interiorul intervalului Dovada Este suficient să arătăm că u + (ѵ u) ] (a) O modificare a ordinii va apărea în sumele Y - , Y ei ~ , Y eoi ~ , £ = , Eooooe = ; ; deci = , (b) După determinarea sumei Y T=i - = , , calculele în conformitate cu ( ) vor conduce la o încercare de a determina rădăcina pătrată a lui - Dar în acest caz calculele conform ( ) și ( ) vor fi exacte [Dacă Xk = + [(A - l)/ J ~ , atunci calculele conform ( ) și ( ) vor da o eroare de ordinul lui n O analiză mai detaliată a preciziei calculării abaterii standard este dat în Chan şi Lewis, CACM ( ), - ] (c) Trebuie să arătăm că φ ((v (c) u) k) este între u și v; vezi ex FCMP STJ F Subprogram pentru compararea numerelor în format JOV OFLO virgulă flotantă Asigurați-vă că indicatorul de preaplin este stins STA TEMP LDAN TEMP V n Este suficient să găsim coeficientul lui xi, deoarece coeficientul lui xk va fi exact același dacă toți indicii sunt măriți cu k - Fie (fk, gk) coeficienții lui xi în ("*, - c*,, c*, respectiv") Atunci /i = ( + Пі)( ~ і - і |w - w| > bp + , prin urmare |/u| > |/v| > - (| - )b~p Concluzionăm acum că condiția de "eșec" necesară și suficientă ( ) este rotunjirea |/w| la, de fapt, aproape în timpul normalizării (de fapt la / după scalare prin deplasarea la dreapta pentru a obține depășire fracțională) Cazul, desigur, este extrem de rar! (soluția lui GW Veltkamp) se poate presupune că p > , deci c este reprezentativ Mai întâi, să calculăm u' = u (r) c, " = (u Ѳ u) (r) u , U = mѲмі; în mod similar ѵ' - ѵ (r) с, ѵi = (ѵ Ѳ v') (r) ѵ', ѵг = ѵ Ѳ ѵi Apoi atribuim w și eu = p, astfel încât u și ѵ sunt € întregi [ P P) Atunci u = ui + u , unde P V I b p~ , atunci xi = uv - r, unde |r| b p , atunci fie X = xi/v + q, unde |g| sau u r], unde x A y \u d y A x , x A + - x pentru toate x, x A - = x pentru toate x / + , x A + oo = + oo pentru toate x / - oo și x A - oo nu trebuie definite; x y = -(( -d) A {-y)) - Dacă x (r) y va depăși la efectuarea operației conform algoritmilor obișnuiți în virgulă mobilă, deoarece x + y este prea mare, atunci x A y este + oo și x ^ y este cea mai mare ca mărime reprezentabilă printr-un număr Pentru scădere, punem și Ѳ ѵ = și φ (-r), unde -v = [-vr -vi] Cu înmulțirea, lucrurile sunt mai complicate Următoarea procedură va da rezultatul corect: let u ѵ= [min(w; V vi,ui V vr,ur^ vi,ur^ vr) max(u & vi, ui & vr,ur & vi,ur A vr)], unde x & y \u d y x, x & (-y) \u d - (x V y) \u d (-x) & y, r A + \u d (+ pentru x> , - pentru i + , -oo pentru x max(e, e') În consecință, atât φ ѵ ~ cât și φ ϵ' ( c + b~p) Dacă b = , această estimare poate fi rafinată la , e + b~p Cu condiția ca e + b~p să fie limita superioară, dacă u - u și v - v, obținem semne opuse, altfel nu poate fi e = e' = e Identitatea formulată este o consecință a faptului că ( u) = și pentru p este satisfăcută, iar această ultimă condiție presupune y = [ P / J = x Vezi Math Comp ( ), - Când = , p = și r > , avem rotund(a:) = e^x), unde e(r) = [lg|;rj Fie f(x) = xa și fie i(n) = Tsap + lg |J/a + Ig |J Atunci A( e) = ^e\ Când a = , obținem A( e) = e pentru / , deoarece d sa p și, de fapt, d - p = - (n mod ) Exemplul dat în condiție este următorul: rzі + (Zdzі - Rzі) ( dzі + Rzі) - rzі ~ (Rzі - + Rzі) - - Scădere în virgulă mobilă p i din ! dă zero, cu excepția cazului în care este posibil să se reprezinte Zd i aproape exact Scăderea lui p^ din dw dă în cazul general o eroare de rotunjire mult mai mare decât psp Un exemplu analog poate fi formulat pe baza aproximării printr-o fracție infinită a oricărui număr algebric SECȚIUNEA (wm,wi) = ( , ); atunci wmvilvm = Deci rezultatul este ( , ) Este corect cu șase zecimale Acest lucru nu va avea niciun efect asupra rezultatului deoarece rutina de normalizare trunchiază până la opt biți și nu ia niciodată în considerare octetul din acea poziție (Deplasarea la stânga are loc cel mult o dată în timpul normalizării, deoarece se presupune că intrarea a fost deja normalizată ) La executarea comenzii pe linia , în mod evident nu poate apărea o depășire, deoarece se adaugă valori de doi octeți Nici nu se poate întâmpla la executarea comenzii pe linia , deoarece se adaugă valori de patru octeți Comanda de pe linia calculează suma a trei valori de patru octeți, care nu poate duce la o depășire În cele din urmă, la executarea comenzii pe linia , overflow nu este posibil deoarece produsul fu fv trebuie să fie mai mic de unu Introduceți comanda "JOV OFLO; ENT " între liniile și Înlocuiți liniile - cu "ADD TEMP(ABS); JNOV *+ ; INC " și liniile - la "SLAX ; ADD TEMP; JNOV *+ ; INC ; ENTX , ; SRC " Astfel, la timpul de execuție vor fi adăugate cinci linii de cod și doar , sau cicluri de mașină Introduceți "JOV OFLO" după linia Schimbați liniile , , în "SRAX ", "SLAX ", respectiv "ADD ACC" Între rândurile și introduceți comenzile "DEC ; JNOV DNORM; INC ; INCX ; SRC " (Este tentant să ștergeți "DEC " și să îl înlocuiți cu "STZ EXPO", dar apoi comanda "INC " poate provoca depășirea registrului rI !) Astfel, programul va crește cu șase linii; timpul de execuție va scădea cu w, cu excepția cazului în care există un depășire atunci când aveți de-a face cu o parte fracțională În acest ultim caz, timpul de execuție va crește cu u DOUBLE STJ EXITDF Convertiți în format de precizie dublă Curăţare ENTX GC STA TEMP LD TEMP(EXP) rI /b, atunci ex + și dacă semnele operanzilor se potrivesc, atunci, din nou, întreaga eroare poate fi atribuită normalizării; dacă semnele sunt opuse, atunci eroarea asociată cu deplasarea biților din registru este opusă erorii care apare după aceea în timpul normalizării Ambele componente sunt limitate la b~ ; deci astfel încât F(r) astfel încât F(r) > - e pentru x > M Poate fi dus la atât de mari încât inegalităţile k ■ bk M\ vor fi satisfăcute (F( fc n- fc)-F( fc'n- fc)) = F( fc *:) + - F( fc fc) r, atunci Po( ns) este egal cu pentru n mic și este egal cu dacă [ nsJ > [ nrJ Cel mai mic n pentru care se întâmplă acest lucru poate fi arbitrar mare, astfel încât nicio estimare uniformă independentă de s nu poate fi dată pentru N(b) (În general, manualele de analiză dovedesc că o astfel de estimare uniformă ar implica faptul că funcția limită So(s) este continuă, ceea ce nu este cazul ) Fie qi, qi, • • ■ astfel încât Po(n) = i( "q ) + r(n ) -Pentru toate n Atunci Pm(n) = l m i(n~ ) + m (n ) + • • • pentru toate tipurile Dacă ' -em sin(m - Trlog g) - sin(m , |(ft(z) - Z(z))/Z(z)| , iar acest lucru se întâmplă cu probabilitatea | (În mod similar, rezultatul efectuării divizării conform algoritmului M nu necesită deplasări de normalizare cu probabilitate |; aici, ipoteza mai slabă a coincidenței distribuțiilor operanzilor independenți este suficientă ) Pentru comoditate, calculele sunt efectuate aici pentru = Dacă k = , atunci probabilitatea de transfer este egală cu \ f dx dy În / x y x+c> (Fig A- ) Integrala este f ^ fW - - Г Г - Jo Jio-y x Jo JlO-y x Orez A- (Ultima integrală este, în esență, una "logo-logaritmică" ) Prin urmare, probabilitatea de transfer pentru k = este [Cometariu Dacă b = și k = , depășirea fracțională are loc întotdeauna, deci această concluzie confirmă validitatea relației Dacă k > , probabilitatea este \ f ~kdy f dx / \ (y- y- \ ІПІО/ / - y J -V Х \ п / n nfc n |Qn(fc+l)y Astfel, dacă b = , depășirea fracțională ar trebui să apară cu o probabilitate de aproximativ po+ pі + p +- • • • Când = , valorile corespunzătoare sunt Po + pі + pі + p + p + OZZrz + Oіbrv + rt + рв + рд + OOІryu + • • ■ Dacă acum folosim probabilitățile din tabel , împărțindu-le la pentru a elimina operanzii zero și presupunând că probabilitățile nu depind de semnul operanzilor, este posibil ca b = să prezică o valoare a probabilității de aproximativ % față de % din ex Cu = , prezicem o valoare de aproximativ %, în timp ce tabelul va da % Aceste discrepanțe, desigur, se află în limite acceptabile, dacă se ia în considerare eroarea experimentală Dacă k = , atunci cea mai mare cifră este dacă și numai dacă are loc o purtare (Este posibil ca pentru > , depășirea fracțională și rotunjirea ulterioară să aibă ca rezultat o cifră inițială de , dar rotunjirea este ignorată în acest exercițiu ) După cum sa arătat în exercițiul anterior, probabilitatea de depășire fracțională este de aproximativ , și , atunci bitul principal este cu probabilitate \ / [Wl~kdy f dx\ Fie e = A /(A + L ), și alegeți N astfel încât |ai + ■ ■ • + an| N Fie n > N/( - b), n > /e astfel încât an > |A Apoi prin inducție n- N O contradicție similară apare și dacă liminf an A ca n -> oo, setăm a*, - Pm(k) - A Dacă m > , atunci ak ) A Vezi J Math soc Japonia ( ), - (Faptul că probabilitatea armonică extinde conceptul de probabilitate obișnuită rezultă din teorema lui Cesâro (Cesâro, Atti della Reale Accademia dei Lincei, Rendiconti ( ) ( ), - ) Persi Diaconis (teză de doctorat, Harvard University, ) a arătat printre altele că definiția probabilității în termeni de mediere repetată este mai slabă decât definiția probabilității armonice, în sensul următoarei formulări stricte: *oo Pm(n) = A, atunci probabilitatea armonică este A Pe de altă parte, afirmația "IO* " are o probabilitate armonică |, în timp ce medierea repetată nu va atribui niciodată o anumită probabilitate acestei afirmații ) Fie p(a) = P(La) și p(a, b) = o p(k) Pentru p(a + ) și rezultă că p(a, b )/p(a, b + ) > (b - a)/(b + - a) (A se vedea formula -( ) ) Acum putem demonstra că p(a, b) = p(a', b'}, dacă numai b/a = b'/a'', pentru orice valoare mare a lui n p(a, b) = p( na , "b) m Concluzionam că ) care nu sunt puteri ale lui [Yaglom A M și Yaglom I M , Probleme non-elementare într-o prezentare elementară (M: Gostekhizdat, ; traducere în engleză, ), Problema b] Cometariu Multe alte secvențe de numere întregi au această proprietate De exemplu, Perși Diaconis, Annals of Probability ( ), - , arată că unul dintre ele este (n!) și că șirul coeficienților binomi se supune de asemenea legii logaritmice în sensul că ^£[ ^ , atunci folosim algoritmul A, în care pasul A se modifică după cum urmează A ' [Adăugați cifre ] Atribuiți Wj b, va trebui să modificați pasul AZ ) ENN N JOV OFLO Resetează indicatorul de preaplin ENTX până la i > J NN B MN (rІЗ = n(r - ) + j ) STA W+N,l N Wj și o)b" • O formă mai precisă a ultimei afirmații este următoarea: ^ u^ + ^ vi^ ~ + Y wib b, atribuiți r , reveniți la pasul B | C Atribuiți j b, atribuiți w; k > J; apoi atribuiți i k > j Apoi atribuiți i , reveniți la pasul C , altfel atribuiți w, k > | Dacă, de exemplu, j \u d n - , atunci k \u d cu probabilitate ( - ) / ; k - cu probabilitate (( - )/ )( - / ), iar aceasta este probabilitatea ca un transfer să aibă loc și bitul anterior să nu fie egal cu - ; k = cu probabilitate (( - )/ ) ( / ) ( - / ) și k = cu probabilitate (( - )/ ) ( / ) ( / ) )( ) Pentru k fix, se pot însuma toate probabilitățile peste parametrul j, care variază de la n - la ; aceasta va da numărul mediu de ori în care transportul se întinde pe k biți: - A , /, \ \ Shk \u d ~ bіg (P + " " b) + bj' Ce Pentru a verifica, găsim numărul mediu de transferuri ( mi - îmi - ■ ■ • - nmn ' ' n - este de acord cu formula ( ) ENT Nl H LDA W K JOV OFLO INCA K STZ W+N STA W, K H LDA U, N INC K ADD V, N JOV B K STA W, N H DECI N JNOV F N J NN B N ENT , L Timpul de execuție al programului depinde de L, numărul de poziții unde u -v} > b, și de K, numărul total de transferuri Este ușor de observat că K este aceeași cantitate care apare în programul A Analiza din textul secțiunii arată că valoarea medie a lui L este N((b - )/ ), iar valoarea medie a lui K este |(Ag - b ~ - b~ - - b~n) Astfel, dacă neglijăm termenii ordinului / , timpul de execuție a programului va fi egal cu N + L + K - i: N - cicluri La pasul A , înlocuiți "b" cu "bj" peste tot Dacă schimbați liniile și , aproape întotdeauna puteți obține un overflow În acest caz, registrul A în timpul execuției comenzii din linia poate avea o valoare negativă, astfel încât programul să nu funcționeze Dacă schimbați liniile și , atunci secvența depășirilor care apar în timpul programului va fi diferită în unele cazuri, dar programul va da rezultatul corect Această problemă este echivalentă cu problema comparării lexicografice a șirurilor de caractere: (i) atribuiți j , atribuiți j Vj, atunci terminați cu [u > v] Acest algoritm se dovedește a fi destul de rapid, deoarece este de obicei foarte puțin probabil ca j să devină foarte mare înainte de cazul în care Uj / vj Folosim algoritmul B pentru Uj = și vj = Wj La sfârșitul acestui algoritm va apărea un alt "împrumut", dar de data aceasta poate fi neglijat ENN N MUL VN STA W+N,l N JOV OFLO SLC N INC N ENTX ADD CARRY N J N B N H STX CARRY N JNOV ♦+ N STX W+N LDA U+N,l N INCX K Timpul de execuție a programului este de LG + K + cicluri, iar o estimare aproximativă a lui K este |A Cheia este afirmația inductivă, care trebuie să fie adevărată la începutul pasului M Toate celelalte afirmații sunt ușor de dedus din această afirmație, care arată astfel; n+ , eroarea este limitată la (n- ) ~n~ , etc Dar, în general, toate produsele trebuie să fie calculate pentru a obține o valoare rotunjită corespunzător ) O analiză ulterioară arată că rezultatul rotunjit corect al înmulțirii părților fracționale ale numerelor în format virgulă mobilă poate fi aproape întotdeauna obținut la un cost de calcul aproape jumătate față de calcularea produsului complet cu dublă precizie Mai mult, verificând, puteți fi sigur că cazurile în care este nevoie de acuratețe deplină sunt extrem de rare [Cm W Krandick, JR Johnson, Proc IEEE Symp Computer Arithmetic ( ), - ] S I Atribuiți r +- , j +- n - Atribuiți wj , reveniți la pasul S | u/v > unbn/(vn-i + ) = ( - l/(vn i + )) > ( - l/( / )) = - (un + u" ! j/(vn i + ) |( - ) Fie u = , ѵ = Să luăm mai întâi q = [yj = Totuși, vedem că • > ( - ) + Apoi punem q = și obținem • / În caz contrar, v{b/(v + )J > v(b - v)/(v + ) > (b - l)/ > L / J - Probabilitatea aproximativă este doar log , nu | (De exemplu, dacă b = , probabilitatea ca vn-i > să fie aproximativ egală cu j? Totuși, aceasta este încă suficient de mare pentru a justifica efectuarea unei verificări speciale a condiției d = la pașii D și D ai algoritmului D ) ENTA ADD V+Nl STA TEMP ENTA JOV IF ENTX DIV V+Nl JOV DIVBYZERO H STA D DECA JANZ ♦+ STZ U+M+N JMP D ENN N ENTX H STX CARRY LDA V+Nl MUL D J N B ENN M+N H STX CARRY LDA U+M+N J N B STX U+M+N (Vezi algoritmul din exercițiul D LDA D DECA JAZ TERMINAT Tranziție dacă vn-i = - În caz contrar, se calculează [ /(v + )J Salt dacă vn-i = Sari dacă d/ -A Atribuiți Um+n -A A Înmulțiți v cu d A UN UN UN (Ca și în exercițiul ) UN A (Acum rX = ) A(M + N) Înmulțiți și cu d A(M+N) (Ca și în exercițiul ) A(M+N) A ENT N- A ENTA A H LDX U AN DIV D AN STA U, AN SLAX AN DEC AN J NN B AN În acest program de diviziune de exerciții, rAX = (Rămânul va fi stocat în celulele U până la U+N- ) Dacă d = , atunci terminați gii = J; j j > I se încheie și, așa cum se va arăta în cele ce urmează Acest număr este du mod dv = d(u mod v) Să presupunem (pentru comoditate) că v are un punct zecimal în stânga, adică că v = (ѵp vp-іvp După finalizarea pasului N , obținem | v(b + - vp- ) > gp- (b+ - vp- ) Vp- + J Vp- + -b Vp- + Valoarea din ultima relație ia cea mai mică valoare la ѵп-і = , deoarece aceasta este o funcție convexă, iar cealaltă valoare extremă a acesteia este mai mare L xo I b(b+ ) IV Formula de la pasul N poate fi rescrisă ca ѵ + /b Vp-i + După o iterație a pasului N , valoarea minimă a lui v nu este mai mică decât /b(b+ ) - Vn- \ v > /b(b + ) - Vn-i \ Vn-i /b(b + ) + -/ - \ \ vn-i + / b ~ \ Vn-i + / b \ t ) \ b ) la t = Vp-i + Minimul acestei valori este atins la t = b/ + , limita inferioară este - / Prin urmare, după o iterație a pasului N , avem vn-i > b - Ca rezultat, obținem ( - / b)( + /b) > , unde b > , astfel încât nu sunt necesare mai mult de două iterații În cazul în care b )зІ ca în algoritmul D Dacă cifrele principale diferite de zero ale numerelor u și ѵ au același semn, atunci atribuim r - u - ѵ, q - ; în caz contrar, atribuim r |m| sau |r| = |m| iar semnul primei cifre nenule a numerelor Uj-i io coincide cu prima cifră nenulă a numărului r, apoi atribuim q dvn-i > b/ În loc să normalizăm u și r la pasul D , determinăm cele două cifre principale ѵ'v" ale numărului е(ѵp-іѵp Vp-z)b deplasându-l la stânga cu e biți La pasul D , în schimb de (гп і, t'n-s) folosim (r', r"), iar în loc de (Ці+n, tij+n-ii ц+п-г) folosim (u ,u" ,u") Valorile cifrelor i'i!'i'" se calculează prin deplasarea numărului e biți la stânga ("j+n ■ ■ ■ Uj+ns)b- Împărțirea cu d este omisă în pasul D (În esență, numerele u și ѵ sunt deplasate "practic" Această metodă reduce cantitatea de calcul dacă m este mic în comparație cu n ) Atribuim lui - n, r - , puneți w = nw' + w" și t + w'v = nt' + ", unde s, atribuiți r - r - s și s - s + (această corecție poate fi necesară de două ori ) Repetați până obținem k = Atunci uv = r + z - z, deoarece w se înmulțește întotdeauna cu n~ k În consecință, r = dacă și numai dacă uv - În caz contrar, rezultatul va fi egal cu s, deoarece uv - s o fc/( fc+j) Este necesar să se afle dacă inegalitatea n mr mod n/ unde anjk este n~ fc mod ( fc + j) Fiecare termen din prima sumă poate fi aproximat prin calculul anjk folosind operații O(log n) (Secțiunea ) în ~m După aceea, obținem coeficientul scalat [ manjk/( fc + j)J A doua sumă poate fi aproximată în ~m calculând de m ori primii săi m/ termeni Dacă m x Ign, intervalul de incertitudine va fi egal cu ≈ /n, ceea ce oferă aproape întotdeauna suficientă precizie [Matematică Comp ( ), - ] Notă Fie £ = e'r'/' = ( + r)/\/ egal cu a -a rădăcină a unității Să luăm în considerare valorile lj = n( - ^/\/ ) Atunci Io = ln(l - /\/ ), h = î? = | În | -iarctan , \u d î \u d I În I - i arctan (l / \ / ), / z \u d îs \u d I În I - i arctan (l / ), C \u d ln (l + l/%/ ) În plus, - SJ / / \u d | (lo + ț-ili + • • • + C " /?) pentru EM+ =A+BCD, fc+ fc> , + g - g C \u d ѵ arctanz, + n/ -zr + r ^*P V r + r ' n , >/ g D = ^ / MCtan mk+a U &>mk + a -^(ln(lz) + (-l)" [ngezhen] n( L(m- )/ J/ ) Calculați v' astfel încât t/vmodb = (vezi exercițiul - ) În acest caz wo = v'uo modb și se poate calcula u' = u - wov, wi = v'u'o modb, etc Ar fi nevoie de aproximativ |n operații de bază pentru a calcula n/ biți în dreapta Astfel, numărul total de operații este |n + O(n), în timp ce algoritmul D necesită n + O(n) operații Pentru a implementa metoda directă de calcul a tuturor n cifre de la dreapta la stânga, sunt necesare operații |n + O(n) [Cm T Jebelean, J Simbolic Comp ( ), - ; A Schonhage și E Vetter, Note de curs în Comp sci ( ), - ] (a) Dacă m = , atunci punem v = u În caz contrar, scădeți xw din (um+ni- • ■ uio)b, unde x = uow modb Aceste zerouri sunt situate în afara cifrelor reprezentării numărului, deci am redus efectiv m cu (Această operație este strâns legată de operația de calcul a coeficientului u/w în aritmetica L-adică, deoarece pentru un număr întreg q este egal cu u/w = q + bmv/w (vezi exercițiul - Avantajul acestei împărțiri este că nu este necesară ajustarea divizorului de probă ) (b) Să aplicăm algoritmul (a) pentru a obține uv Cantitatea necesară de memorie rămâne neschimbată dacă combinați operațiile de înmulțire cu restul modulo după cum urmează Atribuiți la k c+ , avem c [( (c+ ) + -c)/ J > c + Dacă xy/ = ( - ) • mod = , vz = (( - ) • - ) • mod = , astfel încât ti = ■ • + - + = Nu Există cel puțin un număr u pentru care nu sunt îndeplinite condițiile teoremei Necesară și suficientă este condiția suplimentară ■ = u (modulul ) De aici rezultă că o asemenea generalizare nu prezintă interes Din faptul că u = u, (modulo mt), rezultă că u = u (modulo gcd(mj,mJ)) Deci, dacă există o soluție, atunci condiția u, = Uj (modulo gcd(m,,m )) trebuie să fie în mod necesar În plus, dacă u = v (modulo mj) pentru tot j, atunci u - v este un multiplu al lcm(wii, , mj) = m, deci există cel mult o soluție Demonstrarea poate fi completată în mod neconstructiv prin numărarea numărului de r-tuple distincte (ui, ,ur) care îndeplinesc condițiile i)cij-rJ- )cO- )J - Vj-T,mj- mi = • ■ ■ = Uj - vi - vimi- ■ ■ ■ - Vj-imj- mi ur ri) mr- + ••■) mi + u) mod mr, U Fie qk = Qk, rk = Rfc, astfel încât Rk = L'/QkJ și Qk = Qk-i + Rk-i' Este necesar să se arătaţi că + (Rk + ) Ri (Faptul că R* ) Pentru j = , , r, calculăm Ue(j ), jUo(j ), Ve(j ), jVo(j ); referindu-ne recursiv la algoritmul de multiplicare, calculăm W(j) = (t/e(j ) + J[/o(j ))(Ve(J ) + jVo(j )), W(-j') = (t/e(J ) - j[/o(j ))(Ve(j ) - J%(J )) Atunci obținem We(j ) = |(W(ji) + lV(-j)), Wo(j ) = $(№()) - W(-j)) De asemenea, calculăm ll'e ( ) = t/( )V( ) Apoi construim tabele de diferențe pentru polinoamele We și Wo, ale căror grade sunt egale cu r și, respectiv, r - Această metodă vă permite să reduceți dimensiunea numerelor procesate și numărul de operații de adunare și înmulțire Singurul negativ este programul mai lung (pentru că procesul devine mai greu de controlat și unele calcule trebuie efectuate pe numere semnate) O altă posibilitate este de a determina valorile polinoamelor Wc și Wo la punctele I , , , , ( D) În ciuda faptului că valorile numerelor procesate sunt mai mari, calculele sunt mai rapide, deoarece toate înmulțirile sunt înlocuite cu deplasări, iar toate diviziunile sunt efectuate pe numere binare de forma J( i' - ) (Diviziunea după astfel de numere se face prin mijloace simple ) Începem construcția șirurilor q și r cu valori inițiale suficient de mari qo și qi astfel încât inegalitatea din ex După aceea, din formule analoge cu formulele care au precedat Teorema B, putem constata că qi -> şi m] = ( + l/( rfc)) +v/ c?^ '/ c? A:+ (Qk/Qk+i')- Pentru k -+ oo factorul Qk/Qk+i -+ , și deci poate fi ignorat, deoarece este necesar să se demonstreze că r/r ( Qk + y/ Qk + ) + > V Qk + + l/( Rk) Prin urmare, pentru k suficient de mare, rj J/ -' = M Astfel, tk care ne permite să evităm inversarea datelor (inversiunea bit-bit a codului) atunci când efectuăm transformarea inversă A[jl(sfc i, , Sk-j,tk-ji, ■■■ Înainte) poate fi scris ca iar aceasta este egală cu £ upvqS(p, q), unde |S(p, , iar acest lucru se va întâmpla mai întâi pentru automatul Mj la momentul J - De aici rezultă că automatul Mj nu poate avea i o / până în momentul (j - ) În plus, dacă în momentul t în automatul Mj componenta zo / , atunci este imposibil să se facă zo = fără a afecta datele de ieșire Dar ieșirea nu poate fi afectată la valoarea specificată a lui zo, cel puțin până în momentul t + j - , deci inegalitatea t + j - - ) l' K~ ~tl / , unde ut = pentru t > K Trebuie să calculăm convoluțiile cr = ^, j = oa-jbr -j pentru r = K - - z pentru n si Z) n+i = Dn Prin urmare, Dn = ei t+ dacă n are forma specificată Din aceasta rezultă prin inducție că Kn = Zei + ((= e' ei ei '+ De altfel, Kn este impar și puteți înmulți un număr întreg de n biți cu un număr întreg de (n + ) biți prin înmulțirea (Kn + Kn+i)/ numere de biți Funcția generatoare K(z) = n> Knzn satisface ecuația zK(z) + z = K(z )(z + l)(z + ); deci K(- ) = și K(l) = Următoarea diagramă utilizează poziții N + Sn în spațiul de lucru Aici, în notația exercițiului anterior, Si = , S n = Sn, și S n-i = Sn + , adică Sn = ei - et - + - [t = ] Fie N = n - e, unde e este sau , și presupunem că N > Pentru numere de N biți date u = nUi -Co și v = nVi + Vo, |{ o - C i| și |Vo - Vi| în două zone de n biți, pornind de la pozițiile și n-a ( N + ,v) zona de lucru de biți După aceea, produsul este plasat în spațiul de lucru, începând de la poziția Zp + Sn- Următorul pas este formarea unui produs de (n - e)-biți Ui Vi, începând de la poziția Folosind acest produs, schimbăm Zn - e biți, începând de la poziția Zp + Sn, și scrieți în ei valoarea UiVi - (Uq - Ci)(l'o - Vi) + nUiVi- (Rețineți că Zp - e + Zp + Sn = N + Sn-) As ca rezultat, se formează un produs de n biți CoVo, începând de la poziția Se adaugă rezultatului parțial, începând de la pozițiile n + Sn și n + Sn În plus, este necesar să mutați rezultatul de n cifre în locul său final, deplasându-l în jos cu n + Sn poziții Mișcarea finală poate fi dezactivată folosind o metodă ingenioasă care ciclează valoarea de ieșire cu o anumită cantitate în zona de lucru redată Dacă produsul de V nu trebuie atașat la spațiul de lucru auxiliar, trebuie să mai existe aproximativ N biți de memorie (adică, numărul total de biți pentru intrare, ieșire și stocare temporară ar trebui să fie în acest caz de aproximativ N biți în loc de V) ) Vezi R Maeder, Lectore Notea în Comp sci ( ), - Fie m = s + r pentru -s o + ao * T = (cwt = (st = (lb = oz ))) Începeți de la zero Adaugă Înmulțiți cu Adaugă Înmulțiți cu Adaugă Înmulțiți cu Adaugă (Operațiile de adunare și înmulțire cu o constantă în sistemul numeric cu baze mixte sunt ușor de realizat folosind o generalizare simplă a regulii obișnuite de purtare; vezi exercițiul - ) Calculați (u/jBoJ, ((w/BoJ/Bij, etc ; resturile sunt Ao, Ai etc Împărțirea se face în sistemul numeric cu baza bj) d = (h = (m = s )) Începe la și Împărțiți la Rest = Împărțiți la Rest = Împărțiți la Rest = Împărțiți la Rest = Împărțiți la xu rest = Rezultat tone lungi, handredweight, piatră, lire sterline, uncii Propus de G L Steele (Jr ) (GL Steele, Jr ) și Jon L White (Jon L White) și publicat pentru prima dată în revista CACM (iulie, ), , procedura generalizează algoritmul D Taranto pentru B = AI [Setare inițială ] Atribuiți M - e, atunci treceți la pasul A (În caz contrar, fracția cu cifre Af va îndeplini condițiile date ) AZ [Convertire ] Atribuiți M ; în acest caz, puteți merge direct la pasul A și nu salvați noua valoare a lui e ) A [Rotunj ] Dacă u > |, atunci creșteți U-th cu (Dacă u = j este exact egal, atunci este de preferat să folosiți o regulă diferită de rotunjire: "creșteți U-th cu numai când este impar " A se vedea secțiunea ) | * Următoarele denumiri sunt acceptate în tabel: T - tone lungi, cwt - handredweights, st - pietre, Іb - lire sterline, uncii - uncii - Notă, trad Numărul U-th la pasul A nu va crește niciodată de la B - la B În acest caz, dacă (U-m \u d B - ) trebuie să fie M > , niciuna dintre fracțiile cu cifre (M - ) nu oferă suficientă precizie Steele și White, în SIGPLAN Notices , (iunie, ), - , își continuă analiza conversiilor în virgulă mobilă (Vezi și D E Knuth în Beauty is Our Business, editat de WHJ Feijen și colab (New York: Springer, ), - ) (a) l/ k = fc/ * (b) Toți divizorii primi ai lui b împart B Acest lucru este posibil numai când n - , astfel încât U > și v > Cazul , v w definim e si E in asa fel incat sa obtinem le U - %BE~P și U > u + țbe~p; prin urmare, Bp p - |); prin urmare, , atunci u și v sunt divizibile cu cd Fie p un număr prim Dacă pe este un divizor al numerelor uv și uv' pentru e > , atunci fie pe\u și pe\v', fie pe\u' și pe\v\ prin urmare pe\gcd(u, v') gcd(u ', v) Afirmația inversă se dovedește prin inversarea aserției Fie di = gcd(u, v), di = gcd(u', /); atunci răspunsul este w = (u/di)(i>'/^ )sign(i>), w' = I(u /d )(y/di)I cu mesajul de eroare "Diviziunea la zero" la v = di = , t = • - • = - , d = , w = - , w' = Fie u" = u'/di, v" = v'/di Problema este de a arăta că gcd(ur" + u"v, di) - gcd(ui/z + u"v, diu'v") Dacă p este un număr prim și este un divizor al lui u", atunci p nu este un divizor al lui u sau v", și, prin urmare, p nu împarte u" + și "v" Același raționament este valabil și pentru divizorii primi ai numărului ѵ" Astfel, niciunul dintre divizorii primi ai numărului u "v" nu afectează cel mai mare multiplu comun (N - I) + ( V - ) \u d N - ( LG - ) Dacă numerele originale sunt numere întregi binare de n biți, atunci poate fi necesar n + biți pentru a reprezenta numărul t La înmulțirea și împărțirea, aceste mărimi vor respecta regulile /(±oc) = , unde x este un număr finit arbitrar nu este egal cu zero Algoritmii descriși în secțiune rămân neschimbați Acești algoritmi pot fi apoi modificați cu ușurință astfel încât / = x (±oo) = (±oo) x = "( / )", unde " / " este o reprezentare a "incertitudinii" Dacă unul dintre operanzi este nedefinit, rezultatul trebuie să fie și el nedefinit Deoarece subprogramele de înmulțire și împărțire pot satisface aceste reguli naturale ale operațiilor aritmetice extinse, uneori are sens să se modifice și operațiile de adunare și scădere pentru a satisface regulile x ± oo = ±oo, x ± (-oo) = PREA pentru x finit ; (±oo) + (±oo) = ±oo - (Prea) = ±oo; în plus, (±oo) + (Too) = (±oo) - (±oo) = ( / ); dacă unul sau ambii operanzi este ( / ), rezultatul trebuie să fie și ( / ) În mod similar, puteți modifica operațiunile de egalitate și comparație Observațiile de mai sus nu se aplică semnelor de "debordare" Dacă oo este folosit pentru indicatorul de depășire, atunci /oo nu poate fi considerat zero, pentru a nu confunda rezultatele incorecte cu cele corecte Este mult mai bine să reprezentați semnul de depășire prin ( / ) și să fiți de acord că rezultatul oricărei operații va fi nedefinit dacă cel puțin unul dintre operanzii de intrare este nedefinit Acest mod de a indica depășirea are avantajul că rezultatul operațiunilor extinse indică exact care rezultate sunt definite și care nu Dacă u/u' / ѵ/v', atunci ? O abordare este limitarea mărimii numărătorului și numitorului la de biți Atunci ar trebui stocați doar de biți (deoarece bitul principal al numitorului este , cu excepția cazului în care lungimea numitorului este ) Această abordare lasă loc pentru semn și biți pentru stocarea mărimii numitorului O altă abordare este să folosiți de biți pentru numărător și numitor, care necesită până la șapte cifre hexazecimale plus semnul, și un câmp de biți pentru a stoca numărul de cifre hexazecimale în numitor [Luând în considerare formulele din exercițiul următor, prima abordare oferă exact numere finite reprezentabile, iar a doua dă Prima abordare este de preferat deoarece este mai simplă și oferă o tranziție lină între intervale Când se operează pe cuvinte de de biți, lungimea totală a numărătorului și numitorului este limitată la - = de biți ] Numărul de numere care sunt multipli ai lui n în intervalul (a ] este egal cu L^/ziJ - [a/n] Prin urmare, folosind metoda incluziunilor și excluderilor, obținem soluția problema sub forma So - Si + Si - ••• , unde Sk este egal cu ^([Mr/P] - (Mi/P])(^r/P] - IAi/PJ)> însumat peste toate produsele P de numere prime diferite k Se poate exprima răspunsul ca tip (L/z>Lg ) (\ Mg/n\ - [Mі/n\) (L№/wj - LM/nJ) n=l SECȚIUNEA Peste tot, înlocuiți min, max, + cu gcd, lem, respectiv x (mai întâi asigurați-vă că toate identitățile sunt valide chiar și atunci când orice variabilă este egală cu zero) Pentru un număr prim p, fie pi ѵір, , ѵpr sunt puterile numărului p în descompunerea canonică a numerelor u, ѵi, , ѵп- Prin presupunere, ip ѵ Atunci E - F + B Dacă înlocuim datele originale (u, v) cu (v, u), atunci valoarea lui C nu se va schimba, iar numărul F va deveni egal cu C - - F Prin urmare, Elѵe \u d | (Peștera - ) + Vlѵe Pentru prima dată, algoritmul binar atinge pasul B cu valorile u = , v = ; atunci t n(n/A:) = O(n) ) Ș d\nM (d) = &ip- [De fapt, există un rezultat mai general decât în (b), =n - - "G" "GU" un unde însumarea din dreapta este preluată peste divizorii primi ai lui n, iar această sumă este egală cu ns(l - /p() ( - /pr) dacă n = Pi ■ rg" -] Cometariu Prin analogie, găsim mulțimea numerelor întregi k, care cu probabilitate /C(A) = /( n>i Vn l [Deci, media este mai mică decât , deși în cazul în care și și v nu sunt coprime, au cel puțin doi divizori comuni ] + + ^ + "- = + { + + |( + І + + '")- (a) L = ( /m ) Eam d~ ind = - [dodd] d~ Ind = L - | In " , vi = ±v/iz, v- = ^țu/iz (semnul depinde dacă numărul de iterații este par sau impar) Acest lucru decurge din faptul că numerele vi și v sunt coprime (pe parcursul întregului proces al algoritmului) și viii = -ѵгѵ [Prin urmare, la sfârșitul algoritmului, viu = lcm(u, r), dar această metodă nu este cea mai bună modalitate de a calcula cel mai mic multiplu comun O generalizare a acestei metode este discutată în Ex - ] Pentru mai multe detalii despre această problemă, vezi Ex - Ca rezultat al aplicării algoritmului X la numerele ѵ și m, calculăm astfel de valori ale lui x pentru care хv = (modulo m) (Acest lucru se poate face prin simplificarea algoritmului X prin necalcularea U , V și n Pentru m > n = obținem (m - i, ) cu probabilitatea (, iar pentru se pot obține următoarele valori Cazul , m - n Din (r, r) pentru cu probabilitate | sau pentru n = cu probabilitatea Probabilitatea de a cădea în intervalul (n-i, n) este / '+- / '+ pentru este egală cu / n+ - / n, probabilitatea de a cădea în intervalul ( , n) este / " - / n * Aici: după eforturi adecvate (lat ) - Notă, trad Cazul , m > n + Probabilitățile obținute pentru acest caz sunt date în tabelul următor (m-І, p): / - / t p + - ; (m - n - t, rі) : l/ n + t + (l)) n> ' Astfel, în răspuns, coeficientul de la (a + / ) Y este egal cu ~ ( - (|) ) = Cometariu Valoarea exactă a sumelor poate fi obținută după o serie de calcule plictisitoare bazate pe formula generală de însumare pe părți: Pentru x ѵ și ѵ/u , atunci I + Pr(u /x) = I + jGn( /x); în conformitate cu ( ) aceasta este, de asemenea, egală cu ( - Cn(m)) kG(l/( k + )) = S(l) Acesta este un sens care nu are legătură cu clasicul constantă, aproximativ egală cu , După cum a observat Richard Brent, funcția G(e~v) este o funcție analitică impară pentru toate valorile reale ale lui y Dacă punem G(e~v) = Аіу + Аз?/ + As?/ + ■ • ■ = p(e~v - ), atunci obținem - рі = Аі = А, р? = |A, -p = |A + Az, pі = |A + |Az, -p = |A + {Az + As; , n x-' Γ w fc! , ѵ-' T n k! (- ) P" = [J^A*; Un = spre a Iată primele valori: Ai a , A a - , A " , A " - Ghicire fantastică: іm* ioo(-X-ik+i/^ik-i) = /m Conform ( ), partea stângă este egală cu ( /r:)- S(l/ :r)+ S(l/ z)- S(z)+ S( z)- S ( z); conform ( ), partea dreaptă este egală cu S( x) - S( z) + S(l/z) - S(l/ x) - S(x') + S( x) - S(l / x) + S (l/ z) Cele mai interesante sunt probabil cazurile în care x = , x = /\/ și x = φ De exemplu, pentru x = φ obținem G( ) - G( ) + G( / ) - G( ) = C( φ ) Pentru n > în conformitate cu exercițiul - avem k- k- fn = [zn]z^ - k ^jz/ ky = -*(n+ > r- L> j= > k> = = "lB( fc("-z'/n și, desigur, i ~ Tn( ) Din faptul că mn+i i fc(a+ )/(s) = g*(s)/( s+ - ) și f(x) = ^{ f*(s )x~"ds În acest caz, presupunând că g(x) = /( + x), găsim o transformare în formă \ - V - /, / + io ° tis * ds Х ț^ k + х лі Jl/ ioo ( s+ - ljsinrrs Din aceasta rezultă că /(m) este suma reziduurilor dx'/( '+ - ) pentru Rs lk,l>l Transformările Mellin vor avea forma \u d ^a (vV ( ' + - ), GM \u d ~ ), Unde ( \ V' (i + (a ~ A Ș " C to Z> fc> Astfel, pentru S (x) = fe( ) + b(-l)z(lgz+ ) - fe'(l)z/ln + a:B(lga:) - V ^r~ b(~k')( -x')^ k> ^i(id) ^ ^+ i ' fc>i Г (V*) = ^ - w + ad*)), k>l' / a- - K= A(t) = -V' Jîf , "A~ a(- + m"/ln ) e m,g*L v' În ^ \sinh( m r/ln ) / B(i) = A У? ЬС" + m"/ln ) е- т"Л, În \smh( m r /ln ) v ' ' ) p \ ' f іТІ / к ~ ~ тТГІ/ ІП \ - mirit A k In j" ysinh( m r /ln ) \ fc- / J Brigitte Vallee, folosind o aproximare semnificativ diferită de cea folosită de Brent, a propus o analiză elegantă și riguroasă a algoritmului B, care este publicată în Algorithmica ( ), - Într-adevăr, metodele sale de demonstrare diferă semnificativ de metodele cunoscute până acum pentru prezicerea comportamentului algoritmului B, precum modelele euristice ale lui Brent Astfel, pentru prima dată, problema analizării algoritmului binar de găsire a celui mai mare divizor comun, care a dat multe bătăi de cap matematicienilor până acum, a fost riguros rezolvată Prin inducție, pentru m > n, lungimea este m + [n/ ] + - [w = n = ] Totuși, din rezultatul ex rezultă că algoritmul nu poate rula atât de încet Fie an = ( n - (- )n)/ ; ATUNCI a , w, o , = , , , , , , (Reprezentarea binară a acestei secvențe de numere conține o mulțime interesantă de zerouri și unu Rețineți că an = an i + an-i și an + an+i = n ) Să presupunem că u - m+ - an+ > v = an+ pentru m > n Pentru m = n > punem u = max(an+ , an+i) și v = an+ - u Un alt exemplu pentru cazul în care m = n > are forma , D = n, E = n Acesta este cel mai rău caz în ceea ce privește timpul de execuție pentru algoritmul B (Soluție propusă de J O Shallit ) Aceasta este una dintre acele probleme în care, pentru a demonstra ceea ce se cere, este necesar să se dovedească mai mult decât ceea ce se cere Fie S(u,v) numărul de trepte de scădere efectuate de algoritmul B asupra mărimilor de intrare u și v Să demonstrăm că S(u v) v, deoarece S(u,u) = Atunci, prin inducție, S(u, v) = + S((u - v)/ , v) ) = log(u+t>) Și asta înseamnă că cea mai mică pereche de numere care necesită n pași de scădere va fi u = n + , ѵ = n - Când se formează o matrice A (dimensiunea x ) de numere întregi ca A(") = ([,[[ ), astfel încât w este dimensiunea unui cuvânt mașină, urmărim cuvintele cele mai semnificative și cele mai puțin semnificative ale operanzilor (cele mai semnificative sunt folosite pentru a desemna semnul lui t, iar cele mai puțin semnificative - pentru a determina numărul total de deplasări la dreapta), unde u' și ѵ' sunt mai mici decât u și ѵ (În loc să împărțim operanzii impari simulați cu , înmulțim operanzii pari cu până când calculăm un multiplu al lui w ca rezultat al efectuării exacte a deplasărilor Igw ) de patru ori mai rapid decât algoritmul L Când folosim un algoritm similar în exercițiu nu este nevoie de cuvintele cele mai semnificative Algoritmi posibil mai rapid sunt descrişi în J Sorenson, J Algorithms ( ), - ; Shallit și Sorenson, Note de curs în Comp sci ( ), - (Soluție sugerată de Michael Penk ) Yl [Găsiți gradul ] La fel ca în pasul B Y [Setare inițială ] Atribuiți (ui, from, from) - ( , , u) și (t>i, va, ѵz) z) ] Dacă iz este pozitiv, atribuiți (ii," ,"z) *-(ii, i , , i> ) " , ^ ,іа > -u, , obținem m - k + , h = k, t - k + Pentru u = Uj și v = uj i în succesiunea u = , ui = , Uj+i = mіp(| u> - uj i|, | uj - Іbгіу ) obținem s - j + , t = j + și (empiric) m " fu Poate t în limită să fie mai mare mai mult de m/f? Tinand cont ca (a" - ) mod (av - ) = au mod " (vezi relatia -( )), pentru toate numerele intregi pozitive a gasim in cazul general gcd(am - , an - ) = aecdl'm'n) j Pentru toate k = , , , scădem coloana fc-a din coloanele k-, fc-, fc-ro etc Ca rezultat, obținem o matrice triunghiulară cu elemente m* , pe diagonala principală, unde m = d\m Xd Rezultă că xm = ( ) ( ) (n) [În cazul general, se poate demonstra exact în acest fel că pentru o funcție arbitrară f "determinantul Smith" în care elementul (i,j)-ft este /(gcd(i,j)) este egal cu Pm =i d\mp(m/ d)f(d) Vezi L E Dickson, History of the Theory of Numbers (Carnegie Inst of Washington, ), - ] SECȚIUNEA Timpul de execuție este aproximativ egal cu T + , care este puțin mai mic decât pentru programul A /* Kn (m , T , , Xn - , Tn) \ Kn - (T , • • • , Tn - , Tn) Kn - (t , ■ • • , Xn - ) ) Kn(xi, ,Xn)- Prin inducție sau prin calculul determinantului în exercițiu Când toți x sunt pozitivi, atunci q, în ( ) sunt de asemenea pozitivi și qn+i > ?n-i- Prin urmare, expresia ( ) este o serie alternativă cu termeni descrescători, convergând dacă și numai dacă qnqn+i -> oo Prin inducție, dacă toți x sunt mai mari decât e, atunci qn > ( A e/ )"c, unde c este ales suficient de mic încât inegalitatea să fie valabilă pentru n = și Dar dacă xn = / ", apoi qn , atunci Bo = , Bi = Ao, B = Ai, B = A , Bi = A , B = A , m = Dacă Ao = , atunci Bo = Ai, Bi = Ag, B \u d A , B \u d Ai, m \u d Dacă Ao - - și Ai \u d , atunci Bo \u d - (A A ), Bi \u d , B \u d Az - , B \u d AI, m \u d Dacă Ao \u d - și Ai > , atunci Bo \u d - , Bi \u d , B \u d Ai - , B \u d A , B \u d Az, B \u d Ai, m \u d Dacă Ao și arătăm prin inducție pe z că coeficientii parțiali pentru X și Y coincid în cele din urmă Potrivit ex (d) pentru s = rezultatul este evident Pentru s > punem q = az A s , unde , iar An+ = [Tch/G] + + Hn) /V" +iJ, unde V"+ , atunci n Un Deoarece Xn y/ - Vn, deci este suficient să luăm în considerare cazul când Vn > y/ Atunci Un = Anvp - Un-i > Vn - Un-i > y/ - Un-i, iar aceasta, așa cum a fost deja stabilit, este o valoare pozitivă Cometariu În ciclul de repetare avem h/O + Un = Anvp + (h/O - £ P-i) > Vp; deci (p/-NLi+i)/Vn+i] = |An+i + Vn/(y/ + J n)j = An+i = L(\/E + ^n)/Vn+iJ Cu alte cuvinte, n+i este definit de valorile Un + i și Vn+i; valoarea (U" Vp) poate fi determinată prin succesorul ei (Un+i, Vp+i) în perioadă De fapt, din raționamentul de mai sus rezultă că atunci când (vezi exercițiul ) Acordați atenție unui model în expresia rezultată (Schriften der phys -okon Gesellschaft zu Kbnigsberg ( ), - ) Hurwitz a expus, de asemenea, în Vierteljahrsschrift der Naturforschenden Gesellschaft în Ziirich ( ), Jubelband II, § - printr-un număr întreg pozitiv arbitrar (Această procedură prelucrează valorile a patru numere întregi (A, B C D) care au sensul invariant: "tot ce rămâne de făcut este să tipăriți o fracțiune continuă a formei (Ay + B) / (Cy + O), unde y este numărul care trebuie introdus ") Mai întâi, atribuiți j și intrarea nu este completată, inegalitatea v = ( n + )An(z) + z An-i(z) Prin inducție, obținem asta Kp Kp-! p - z p - z An( z) + An(- z) n+ zn A"( z) - An(- z) n+! zn Prin urmare, și se cere să se arate că acest raport tinde spre tanh r În virtutea ecuațiilor -( ) și -( ) avem De aceea r- (- ) - L Y = " ( ) = (-!)•,"■ Y fc> v Mai mult, avem (e z - )(An( z) + An(- z)) - (e z + l)(An( z) - An(- z)) = Rn( z); de aici tanhz - //z , z \ i\ -i // Rn( z') (An( z) + An(- z))(e^ + ) Deci, pentru diferența luată în considerare, s-a obținut o formulă exactă Pentru | z| "! (C"")-(V) - (V) -(V) - ) ( p)! / \ ( n)! -n! V ~ n! ' Astfel, convergența este foarte rapidă chiar și pentru valori complexe z Pentru a trece de la această fracție continuă la fracția continuă pentru e, putem folosi egalitatea tanhz = - /(e r + ) După calcule simple, obținem reprezentarea (e r + )/ sub forma unei fracții continue Regula lui Hurwitz dă expansiunea continuă a fracției a funcției e z + , din care rămâne să scădem unul Pentru p impar e~ /n - u n -i- [n/ J, ( m + )n, ( m + )n + [n/ j, //, m > O altă dovadă a fost propusă de C S Davis și publicată în J London Math soc ( ), - Prima extindere a numărului e într-o fracție continuă a fost obținută empiric de Roger Cotes, Philosophical Trans-actions ( ), - , Proposition , Scholium Euler a comentat aceste rezultate într-o scrisoare către Goldbach din noiembrie , [Correspondance Mathematique et Physique, editată de PH Fuss, (St Petersburg, ), - ], și a publicat, de asemenea, o descriere mai detaliată a acestor rezultate în Commentarii Acad sci Petropolitanas ( ), - ; ( ), - (b) //xi - , , - , , (r) - , , , , X n-i - , , X n - // [Notă Negativ- parametrii semnificativi pot fi excluși din continuarei folosind identitatea Km+n+ (^ , • • • - X, Yn, • • • , Yi) ■- ( ) Ktn+n+ (x > • • • Xm- , (r)m j ) , J/n, • • • , Yi ), din care, după aplicarea repetată, puteți obține ■Ктп+п-ьІ ((r) , , Im, X, Yn, , J/ ) = К^тп+п+З ((r) , ■ • • , (r)т- , Гт , , (r) , , Yn , J/n - , • • • , J/ )■ O identitate similară apare în Ex ] (c) + // , , , , , , // = + // m + , //, m > Întrucât, în virtutea identităților ( ) și ( ), Kt (а , а , , С m) // , , , De la, x// - Km- ((r) , • - • ,Ot) + ( ) / (tfm-l (Oi, • • • , Ot- ) "b Kt (&! , (r) , • • • , ^m )l ), va fi satisfăcută și Km(ai, ar, ■ , at) Caj, ar, , am,(r)i, ai, ar, • • •, am, X , ai, ar, •, at, xs, Oi , C = Km-i(ai, ,aa) + //(- )m(C + Axi\C + Ax , (~T)m(C + Ax ), ■ //, unde A = Km(ai, a , ,am) și C = Km-i(a , ■ ■ ■ ,am) + Km-i(ai, ,am-i) În consecință, datorită ( ), diferența dorită este egală cu (Km- (ag, • , Ot ) Km- (Oi, , Ot - i)) / Km (ai, Og, , Osh ) • [Cazul când m = a fost considerat de Euler în Commentarii Acad sci Petropolitanae ( ), - , § - ] Suma pentru φ, minimul este atins în punctul x = și , ; se obțin limite: ( , )n Funcția Rn în această identitate are o derivată a doua continuă Prin urmare, în acest caz R'n(x) = ( -") oo [A Khinchin, în Compas Matematică ( ), - , a demonstrat că această sumă AI - Un din primele n rapoarte parțiale ale unui număr real X va fi egal cu aproximativ n lg n pentru aproape tot X În ex arată că situația este diferită pentru numerele raționale X ] Orice unire de intervale poate fi scrisă ca o uniune de neintersectare intervale, deoarece avem = Ufc>i(^fc \ Ui , At > și Ki(Ai, A?, ,At) este un divizor al lui n Prin urmare, ( ) completează demonstrația [Cometariu Dacă mi/n = CAi, ,AiC și mr/n = //At, ,AiC, unde mi și m sunt coprim cu n, atunci rnirpg = ± (modulo n) Aceasta este condiția care determină corespondența în cauză În cazul în care Ai = , conform ( ), are loc o simetrie similară ] Demonstrăm mai întâi rezultatul pentru n = pe, iar apoi pentru n = rs, unde numerele r și s sunt coprime O modalitate alternativă este să folosești formula din exercițiul următor (a) Partea stângă este o funcție multiplicativă (vezi exercițiul - ) Ea este usoara se calculează când n este o putere a unui număr prim, (c) Ținând cont de (a), avem formula de inversare a lui Möbius (MbNiz): dacă f(n) = Ș d\n (d), atunci s(Tl) = /z(n/^ )/(£^)- Suma este aproximativ egală cu ((( Ip )/m ) lnN!)/N - Yd>iA(d)/d + , ; aici A(d)/d converge la o valoare constantă - £'( )/C( ), în timp ce conform aproximării Stirling, In AP = Nin N - N + O (log N) Modificarea propusă a algoritmului afectează calculele numai dacă următorul pas de împărțire prin algoritmul nemodificat are ca rezultat un coeficient egal cu În acest caz, acest următor pas de împărțire va fi sărit de către algoritmul modificat Probabilitatea ca un anumit pas de împărțire să fie sărit este egală cu probabilitatea ca Ai = și ca acest coeficient să fie precedat de un număr par de coeficienti egal cu Ținând cont de condițiile de simetrie, constatăm că aceasta este probabilitatea ca A* = și că pentru acesta este urmat de un număr par de câte egale cu Acesta din urmă apare dacă și numai dacă Xk-i > φ - = , , unde φ - raportul secțiunii de aur: într-adevăr, Ak = și > dacă și numai dacă I dacă și numai dacă | Acest rezultat a fost obţinut de A Dupre şi publicat în J de Math ( ), - vizionare", propus de J Binet (b) Termenul Km-i(xi, ,xm-i)Kn-i(xm+ , ,xm+n) corespunde acelor cuvinte de lungime m + n în codul Morse pentru care liniuța se află în pozițiile m și (m + ); celălalt termen corespunde cazului opus (Puteți folosi și exercițiul O identitate mai generală Xm+n ((r) ,• , % m+n ) Xk(Xm+l} • ■ , ^m+l*) - Xrn+k('Cli • • • , %m+k )#n (I-m + l ț • • * I-TP -P ) + (- ) ' m - (xi, , Xm- ) Kn - k - (^m-hfe+ , • • • > ^-m+n) publicată și în lucrarea lui L Euler ) (a) Noile reprezentări sunt x = mfd, y = (n - m)/d, x' - y = d = gcd(m, n - m) pentru i/> ca:±i/ poate fi scrisă unic ca x = Km(xi, , xm), y = Km-i(xi, ,xm-i ), unde хі > și m > ; aici y/x = Txm, ■ ■ ■ ,Xi//- (e) Este suficient să arătăm că £i x' au proprietatea x' ( /)/ / = E"=i[d\l/] M(d)/j/d = Ecd avem hd(n) = n(( In )/m ) ln (n/d) + O(n) pentru d > Ca rezultat /i(n) = Y,cd\np(d)hc(n/cd) = (( In )/m )tі( n tі - E "E') + O(na-i (ti) ), unde sumele reziduale sunt = Ec , Ci > și Ci + • • • + Cn i = N + n - În aceste condiții, Un = Ptj ■■■Ftn i poate fi minimizat luând Ci = , U > ■■■ > un, atunci soluția ui = Plg n+ + , U = ■ ■ • = un-i = Pdg n+ , un = Fn-u+ are un minim u [Cm SACM ( ), - , - ] Vezi Proc amer Matematică soc ( ), - ; vezi si ex - Fie m = {p/f], astfel încât m/n = f~ + b = //ai, ar, • //, unde ; atunci ( , prin urmare k este par și (φ k+ - φ~ )e/y / [Ann Polon Math ( ), - ] Minimum ; nici o singură fracție cu numitor yj + [td+i / oo]; Xj + [xj+i/oo]) [O altă modalitate de a deriva această metodă se bazează pe teoria din exercițiul următor ] Se poate dovedi prin inducție că prqi - piqr = este valabil la fiecare nod, adică numerele pi și qt sunt coprime Deoarece p/q sunt //I - , + , - , , I, l - l, I - , , I - , , , I - , + ,I - , - , // a n-a relație parțială an depinde de secvența dragon ale cărei elemente sunt reprezentabile în n mod astfel: dacă n mod = , atunci coeficientul este l - +dn-i + ([n/ j mod ), dacă n mod = , atunci este egal cu + - dn+z - (Ln/ J mod ); dacă nmod = , atunci este egal cu sau Ik'(-k~ '> - în funcție de dn = sau , unde numărul k este cea mai mare putere a lui care împarte n; dacă nmod = , atunci este egal cu Іk'(-k~ '> - sau , în funcție de faptul că dn+i = sau , unde numărul k este cea mai mare putere a lui care împarte n+ Pentru I = , se aplică aceleași reguli, dar zerourile sunt excluse din considerare; prin urmare, în funcție de n mod , se obțin modele mai complexe [Sl și Axj+ + pzj+ Ѳ și Axj+r + pzj+ Ѳ/zj și A > - /xj+ Ѳ - Xpzj+iXj+ /Ѳ Ѳ, atunci nu există o soluție, deoarece valorile corespunzătoare de pe cale au numitori și mai mari În caz contrar (±x, ^y) este soluția obținută pentru x A y Este ușor de observat că dacă y = , atunci nu există o soluție și că dacă y / , atunci semnul markerului de la următorul nod al căii nu va coincide cu semnul lui y Prin urmare, nodul z/x va fi procesat de algoritmul X și pentru unele j x = Xj = A'j-i(ai, ,a , i), y = yj = (-l)(j ) A 'n J(aj+i, ,a")d, z = Zj = /£" - ( , ■ • • , )) este, prin urmare, singura soluție care oferă x ± y și x &= unde DO =Ei oo densitatea ГЦйі( - k/t) = exp(-/(/ - )/ mp + O(/ /m )) tinde să fie distribuite în mod normal, deci putem presupune că valorile lui sunt distribuite uniform Atunci funcția - v - - ~ v are o valoare medie de /( n ), iar numărul mediu de iterații necesare executării algoritmului B tinde spre valoarea ( /( n ) + |)h/mt / = , -Yyi- Ca urmare a unei analize similare a unei metode mai generale, care se realizează în exercițiu - , se obține următorul rezultat: ~ \/t, unde pia este ales "optim" ca rădăcină a (p - ) Ipr = p - p + (vezi BIT ( ), - ) Algoritmul B este un algoritm Pollard rafinat, pe baza căruia soluția ex - (b) în loc de soluția negăsită încă a ex - Pollard a arătat că numărul minim n astfel încât X n = Xn este egal cu valoarea medie ~ (m / )f(m) " , \/rn; această constantă r / rezultă din ecuația -( ) Astfel, suma medie totală de calcule ale algoritmului original Pollard este de aproximativ , >/m - numărul de operații pentru calcularea celor mai mari divizori comuni (sau înmulțiri modulo mn) și , >/m operații pentru calcularea pătratului Acest lucru este într-adevăr mai bun decât rularea algoritmului B în cazul în care costul calculării celui mai mare divizor comun este mai mare decât costul calculării pătratului înmulțit cu constanta , , așa cum este de obicei cazul numerelor mari Totuși, Brent a atras atenția asupra faptului că algoritmul B poate fi îmbunătățit dacă, pentru k > / , căutarea celui mai mare divizor comun este exclusă din acesta; dacă execuția pasului B se repetă până când inegalitatea k [ y / N ] = , în care toate condițiile sunt satisfăcut, dă x = ; dar calcularea rădăcinii pătrate a lui - , = nu are ca rezultat un număr întreg Cu toate acestea, următorul eșantion dă - = = și, ca rezultat, obținem AND = ( - ) • ( + ) = • V Să numărăm numărul de soluții (x, y) ale ecuațiilor congruente N = (r - y)(x + y) (modulo p), unde c(k) lnț(k)/k este constanta Mertens egală cu , ; vezi F Mertens, Crelle ( ), - ; Greene, Knuth, Mathematics for the Analysis of Algorithms (Boston: Birkhâuser, ), § În special, numărul de operații efectuate de algoritmul original Nicomachian este ArlnlnN+O(Ar) În ex - și Secțiunea discută modalități de îmbunătățire a eficienței metodelor de cernere pentru generarea numerelor prime Dacă p este un divizor al lui n pentru un număr prim p, atunci p este un divizor al lui A(n), dar nu al lui n - divizor al numărului A(n), și prin urmare pir - = ( modulo p - ) Deoarece pr = , atunci pi - este un multiplu al pr - , dar acest lucru contrazice presupunerea că pi A Dar , atribuiți r = aiEij -I-\-atEtj este par pentru toate j Atunci x = ±y (modulo M) și x = y (modulo N ) Este ușor de observat că această soluție poate fi transformată într-o pereche (x, y), care apare la executarea etichetei F , prin efectuarea unei serii de operații în care perechile (x, y) sunt imputate succesiv prin perechi (xx) ', yy'), unde x' = ±y' (modulo ,/V) ] Există valori d ale lui x care au aceiași exponenți (eo, ,em), deoarece dacă N = qț q^d, semnul lui x modulo qț' poate fi ales arbitrar Multiplicatorii lipsesc pentru exact două dintre aceste valori d Deoarece P = kNQ (mod p) pentru orice divizor prim p al lui V, obținem = p (pD/ = (kNQ )!p~ !/ = (k /V)(p )/ (mod p) pentru P £ Un =(an-bn)/jD, unde a = l(P + v/D), b= ț(P-jD'), D = P - Q 'Atunci n~ Un = (ch+i)-^" - fc prin urmare Up = p(p- )/ (modulo p) dacă p este un prim impar număr În mod similar, dacă Vn - an + bn = £ + - QUn-i, atunci n Vn = ( ^)Pn fcD* și Vр = Рр = Р Astfel, dacă Up = - , obținem că UP+i modp = Dacă Up = , atunci (QUp-i) modp = Aici, dacă Q este un multiplu al lui p, atunci Un = pn (modulo p) pentru n > , deci Un nu va fi niciodată un multiplu al lui p; dacă Q nu este un multiplu al lui p, atunci Up i modp = Prin urmare, ca și în Teorema L, Ut mod N - dacă W = p' p'r, N Q și t = lcmj )) Conform ipotezelor din acest exercițiu, rangul de apariție al lui N este N + ; prin urmare, N este coprim față de Q și t este un multiplu al lui N + În plus, ipotezele acestui exercițiu implică faptul că fiecare pj este impar și fiecare este egal cu ± , deci i ) = (l)rN, deci r = și t = p' + eip' - Prin urmare, ei = și ei = Cometariu Pentru ca verificarea să fie eficientă, P și Q ar trebui alese astfel încât verificarea să fie efectuată cu o oarecare probabilitate Lehmer a sugerat să se aleagă P - astfel încât D = - Q și să se aleagă Q astfel încât N ± QD (Dacă ultima condiție nu este îndeplinită, atunci numărul N nu este prim, cu condiția ca numai condiția |QD| setăm q = + qi qt, unde t > și q\, , qt sunt numere prime Dimensiunea arborelui xa Prin urmare, xG'(t)dt = (tt(xt+dt) - "-(x )) • x ~ (C(i/( - t)) - F(t/( - *)))• Probabilitatea ca p( i ~ ), deoarece numărul n este coprim la n - Dacă unele wi > , atunci ni - În legătură cu aceasta, putem presupune că numărul n este egal cu produsul lui m n, numere prime diferite Fie n, l+ kiqi, unde ki fci, atunci bn = i • • • r ( + o<> )/ fcir = l/( r - ) + ( r - )/( fcir( r - )) (φ " )/ ) va fi impar dacă și numai dacă pentru un număr impar de numere p ; și qj ține = (modulo ), ceea ce se întâmplă dacă și numai dacă numărul (p - )( ~ )/ este impar [CU GJ Jacobi, Bericht Konigl Prelifl Akad IViss Berlin ( ), - ; V A Lebesgue în J Math Pure Appl ( ), - , a examinat eficacitatea acestei metode ] (b) La fel ca în ex , putem presupune că n = pi n, unde toate n, = + k'qt sunt numere prime diferite și fci /r, și o contradicție dacă ki | numai când n este un număr Carmichael pentru care k este prim dacă și numai dacă este verificat de algoritmul P de x pentru x = xi, , x = xm, unde m = lLlgnJ([lgnJ - ) Există o secvență cu aceleași proprietăți, dar în cazul în care m = O(logTi)?] Această teoremă a fost prima dată riguros demonstrată de von Mangoldt [CreA le ( ), - ], care de fapt a arătat că restul termenului ( ) este C + dt/((t - l)tlnf) minus / /s cu condiția ca numărul n să fie egal cu puterea k a unui număr prim Constanta C este Іі -Іп = + In In + En> (f + I) > (/ + )r > N, iar egalitatea nu poate fi valabilă [Pro Pisică PhiJ soc ( ), - ] Dacă numărul k nu este divizibil cu și dacă k fiecare dintre aceste soluții corespunde unui singur întreg Рі pp' (mr/ / ) / mr/( d(r / )! ) [Informații suplimentare, referitoare la subtilitățile aplicării teoremei D sunt date de Schnorr în J Algorithms ( ), - ] Pentru a arăta că Pr(X M, îl codificăm sub forma x mod IV, ca mai înainte, dar pentru x ( " - IO- ), deci există o șansă bună de a găsi un factor prim după efectuarea a aproximativ operații aritmetice logm modulo N Pe de altă parte, dacă P> | și Q > atunci P și Q " , deoarece există o formulă de bază P = gcd(m, p - )/p', deci într-un astfel de caz m este un multiplu al lm(p - , q - ) Să presupunem că m = k, unde r este impar, și să construim secvența xT mod N, x r mod N, , x r mod N; la fel ca în rezultatul executării algoritmului P, constatăm că pentru prima dată apare după valoarea lui y, care nu este egală cu N - , cu o probabilitate nu mai mică decât, deci, gcd(t/ - , N) = p sau q Fie f = (p~ - qp~ ) modN Deoarece pmod = q mod = , atunci (^-) = (-) = (t) = -(t) = - și, în plus, (|) = - (|) = - Fie pentru un mesaj dat x în intervalul p ± , vezi Matematica lui Giinter Loh Comp ( ), - În special, a descoperit că numărul • k - este prim pentru , atunci j poate fi redus cu atribuind k ( n)n+ (vezi AMM ( ), - , ) ] (b) Mai întâi, ca în (a), calculați A = +, apoi găsiți cel mai mic k > astfel încât fc+ ! mod n = Dacă gcd(n, fc!) , punem f(n) egal cu această valoare; rețineți că acest cel mai mare divizor comun poate fi calculat folosind algoritmul lui Euclid în cicluri O(logn) Dacă mcd(n, k!) = , se poate găsi cel mai mic întreg m astfel încât (^ j) m°dn = și se poate pune f( n) = mcd(m, n) (Rețineți că în acest caz k , u' = (A + l) F>+' , v = Am, w = (A + l) m, ( (tm)) modn / și ( m + m°dn = Acest lucru poate fi obținut cu ușurință pentru m = Fj + i pentru j suficient de mare în O(logn) cicluri; în plus, A va fi mai mare decât ^m + s\ Execuția algoritmului se încheie în acest punct, altfel micșorăm j cu astfel: mai întâi atribuim r (b) Se obține f (N ,N) = E v ) (Problema este să găsim toate perechile de numere întregi (A, p) astfel încât (A + r)(p + r') = N; deci xu + p = w (modulo h) și y/Xpv , iar pentru a = + și - se imprimă valoarea lui Xs + r dacă d = (inj + ^ + izg + uj') - ѵi ѵz-ZV - un pătrat exact și dacă numerele wvis + ks - vzg + vig' + crx/d wvis + ks + v r - vir' - cry/d A = - p= - ѵзз шз sunt numere întregi pozitive (Soluții pentru Ar> + pvi = wvi + ks, (As + r)(ps + r') = N există ) L [Finalizat?] Dacă de la = , atunci execuția algoritmului se termină L [Împărțiți și scădeți ] Atribuiți q Unii factori pot fi ieșiți de mai multe ori ] (a) În primul rând, verificăm că simbolul Jacobi este + (Dacă este egal cu , problema se simplifică; dacă este egal cu - , atunci y ț Qm ) Atunci alegem numere întregi aleatorii xi, , Xn în intervalul [ w) și setăm Xj = [G(y Xj mod m) = (yx mod m) mod ] Dacă y E Qm, atunci E Xj > I + e; în caz contrar m este y Qm și E Xj În virtutea rezultatului exercițiului - probabilitatea de eșec nu depășește valoarea e~ e n Prin urmare, alegem n = [|e~ În "| (b) Găsiți x cu simbolul Jacobi (^) = - și atribuiți y - x mod m În acest caz, factorii numărului m vor fi mcd(a: + y/y, m) și m), deci problema acum este să găsim ±y/y pentru y Qm dat Dacă găsim rv pentru orice valoare diferită de zero a lui ѵ, atunci problema va fi rezolvată, deoarece y/y = (v ti") modm, dacă gcd(v, m) nu este un factor al lui m Să presupunem că pentru unele e > egalitatea e = ~e este valabilă Alegem numere întregi aleatoare a și b în intervalul [ m) și presupunem că funcțiile binare ao și / sunt cunoscute, astfel încât inegalitățile eu ha Aceasta eu e - ao - ± Algoritmul este executat în cel mult r pași La începutul etapei t, pentru ( - ^)m sunt satisfăcute Fie Yj = ( Gj - l)xutj Dacă Yj = + , acesta este un argument în favoarea lui A ~t I = ; dacă Yj = - , atunci în favoarea lui A I b = , dacă j = , atunci nu se ia nicio măsură Să fim democratici și să setăm A " b = [ "£ - "/ > ] Care este probabilitatea ca X ~t b să fie valoarea corectă? Fie Zj = - dacă XUtj yi și {rutj ( - ^)m, sau G(w jj/modm) yl Aw"j) În caz contrar, presupunem că Zj - |xuol Deoarece Zj este o funcție a lui Utj, variabilele aleatoare Z sunt independente pe perechi și distribuite egal Fie Z = Zj- dacă Z > , valoarea A ~( va fi corectă Probabilitatea ca Zj = să fie egală cu și probabilitatea ca Zj = + să fie egală cu > | | prin urmare EZj > |b Evident, var(Zj) ^rL ) | + e Să presupunem că j=oa'Ja;J = (n modulo mj, gcd(aio,Oii, ,a,(rf i),ms) = și |d?| nn/ n ! dd, unde n = d + k În primul rând, găsim o astfel de succesiune de valori II, , uk, astfel încât egalitățile uj modrn, = să fie satisfăcute Acum formăm o matrice de dimensiune n x n \ / M tM L = O I manui ^ la PkoPk makiuic md ai(d i)Ui M/m-id md~la (di)u M/m d M/mkdJ unde M = mt tk Toate elementele supradiagonale ale acestei matrice sunt egale cu zero, deci detL = Mn~ mk~ d~k Acum să fie v = (to, ■ ■ ■ ,td-i,vi, ■ ■ ■ ,u) un vector diferit de zero cu componente întregi de lungime (r)b) lnm^k~ '>lnd~kln Deoarece d/ valoarea minimă la care este satisfăcută egalitatea (zțp) = - ; apoi Xg - a = -ja și b = -ja(yo) pentru niște xo și yo (modulo n) Prin urmare, (aoyo) - ayo = b Să presupunem acum că am găsit o soluție pentru ecuația x - ay = b (modulo n) și trebuie să o extindem la soluția modulo n Se pot găsi întotdeauna valori pentru parametrii c și d astfel încât (x + cn) - a(y + dn) = b (modulo n ), deoarece (x + cn) - a(y + dn) = x - ay + ( cx - ayd)n și gcd( x, ay) ± n Prin urmare, în cazul în care n este o putere a unui prim impar, o soluție există întotdeauna (De asemenea, trebuie să presupunem că și numărul n este impar, deoarece, de exemplu, ecuația x ± y = (modulo ) nu are soluții ) Astfel, în conformitate cu teorema chineză a restului, există o soluție pentru toate impare n Corolarul Pentru a și n dat, pentru care a ± n, numărul de soluții este același pentru toate b - L n Aceasta rezultă din identitatea dată în indicația și fapta , deoarece dacă x - ay = b, atunci - ayy , xpy + x yi) satisface toate soluțiile ecuației x - ay = b de îndată ce (x , y ) satisface toate soluțiile ecuației x - y = Cu alte cuvinte, perechea de soluții (x , y ) este determinată în mod unic de perechile de soluții (x: i , p i) și (x, y) , de îndată ce obținem x - ay ± n Corolarul Având în vedere numere întregi (a, s, z) astfel încât z = a (modulo s), se pot găsi numere întregi (x, y, m, t) pentru care egalitatea x - ay = m st , unde (x,y ) ( , ) și i se poate face după cum urmează Alegem mai întâi numerele u și v ca numere aleatoare între și n - , apoi calculăm valorile w = (u - av ) modn și d = gcd(w, n) Dacă , atunci n poate fi redus; metodele folosite pentru a demonstra Corolarul vor converti soluțiile obținute pentru factorii lui n în soluții pentru numerele în sine n Dacă d = n și v ± n, atunci (w/u) = a (modulo n); prin urmare, este posibil să se micșoreze a cu În caz contrar, d = ; să presupunem că este bwmodn Acest număr z, conform Corolarul , este distribuit uniform între numerele prime până la n Dacă (ț) = , vom încerca să găsim o soluție la ecuația z = a (modulo s), presupunând că z este a număr prim (Ex - ) Dacă soluția nu a putut fi găsită, facem o a doua încercare cu o alegere diferită a numerelor aleatoare u și r Dacă se găsește soluția, presupunem că z = a + m și calculăm d = gcd(ms, n) Dacă d > , atunci simplificăm problema în conformitate cu procedura descrisă mai sus În caz contrar, folosim Corolarul pentru a găsi x - ay = m st pentru t , putem reduce parametrii n și a; altfel obținem (X/Y) - a(l/Y) = t (modulo rі) Ca urmare, această identitate dă o soluție pentru ecuația x' - ay' = s (vezi Corolarul ), care conduce la soluția dorită, deoarece u - av = /b În practică, de regulă, sunt necesare doar numere de încercare aleatoare O(log i) pentru a garanta executarea cu succes a acestui algoritm în conformitate cu ipoteza făcută Dar pentru o dovadă formală, va fi necesar să se țină cont de ipoteza Riemann extinsă [IEEE Trans IT- ( ), - ] Un algoritm mai complicat și mai lent, care nu se bazează pe niciuna dintre ipotezele nedovedite, a fost propus de Adleman, Estes și McCurley [Math Comp ( ), - ] [FOGS ( ), - ] După numere se obține un n Prin urmare, dacă tipul mai mare decât d = deg(gcd(îi, r)), Todeg(lZ) nі > • • • > nt > având o valoare dată t; atunci valoarea medie este St(p - t)t/prl Fie /(m, ,nt) - t; atunci St = (")t, astfel încât media să fie egală cu n(l - /p) Valoarea Q)(l ~ /p)- Și în sfârșit, pentru /(nі, , nt) = (n - Pi)nі + • • • + (n"-i - nt)nt ^=ga-("+i)em+(pg)(?) iar media este (n+!) - (n + l)p/(p - ) + (p/(p - )) ( - l/pn+ )- (Probabilitatea ca nj+i = nj - pentru și pentru n = Presupunând că termenii constanți w( ) și r( ) sunt nenuli, imaginați-vă un algoritm de împărțire "de la dreapta la stânga", u(x) = v(x)q(x) + xm~ng( x), unde deg (r) oo [vezi JACM ( ), - ] Prin inducție pe j se poate arăta că valorile (uj+i(x),gj+i, hj) se înlocuiesc respectiv cu valorile (^I+P; w(x)uj(x), t +p > gj^hj) pentru j > , unde pj = nj + nj - nj [În ciuda acestei creșteri, fețele ( ) rămân valabile ] Fie p un element simplu din regiunea dată și fie j, k maximul astfel încât pk\vn = £(v), pJ\vn-i Fie P = pk Conform algoritmului R, putem scrie q(x) = ao + Paіx + - ■ + Psasxs, unde s = m - n > Se consideră coeficienții la xn + І, xn și xn în v(x)q( x), și anume - Paіѵp + P azvp-i + • • •, аоѵp + Раіѵp-i +• • • și аоѵp-i + Раіѵп- + •••, fiecare dintre ele este multiplu al lui P Concluzionăm din primul că pJ\ai, din al doilea că cel mai bine se poate dovedi că p^ i împarte r(x) De exemplu, uită-te la u(x) = x + , v(x) = x + x + , r(x') = Pe de altă parte, se poate folosi un argument bazat pe determinanți matrici ca ( ) și ( ) pentru a arăta că ^degM-degtr)-!, ^ este întotdeauna un multiplu de (grade(u)-grade(v))(grade(v)-grade(r)- ) j Fie Cij = aiiaji + • • • + ainaJn Putem presupune că cc > pentru tot i Dacă c,j / pentru unele i / j, atunci putem înlocui rândul r și coloana i cu (cj - tcji, , ctn - tcjn), unde t = Cij /cj \ această operație nu modifică valoarea de det C și reduce valoarea limitei superioare, pe care o demonstrăm, deoarece cc este înlocuit cu cc - c,j / Cjj O astfel de substituție se poate face sistematic pentru creșterea i și j Un polinom dintr-o variabilă de grad d peste orice domeniu al unei descompunere unică nu are mai mult de d rădăcini (vezi exercițiul - (b)); astfel încât dacă n = , atunci este clar că |r(Si)| avem f(xi, ,xn) = up(x , ,xn) + хіді(х , ■ ■ ■ ,xn) + • • • + xf gdi (r, , ip), unde gk este un minim diferit de zero pentru un k Pentru date (xr, • • •, xn) rezultă că /(хі, ,хн) este egal cu zero cel mult pentru valori di хі, cu excepția cazului în care q(x , ,xn) = Prin urmare, |r(Si, , Sn)| + Această observație garantează că di + • • ■ + dn , putem obține dj = , deoarece Xj trebuie să fie egal cu , când fj+i(xj+i, ,Xn) / Prin urmare, polinoamele rare cu doar m termeni nenuli vor avea dj q și dacă |/ ( хі, ,тп)| , deg(Qi) deg(V) Dacă deg(jR) >deg(V), atunci rețineți că htoQiU - Q V = QiR - (Q - QiQ)V are un grad mai mic decât deg(V) j) TI [Inițializare ] Setați { j Fie Tkj un element diferit de zero al lui {TtJ-,T(j+i)j, Tmj} cu cea mai mică valoare absolută Să schimbăm rândurile k și j ale matricelor T și V și să schimbăm coloanele k și j ale matricei U Apoi scădem rândul j din rândul i \Tii/Tc\ ori în matricele T și V și adăugăm de același număr de ori coloana i la coloana j în matricea U pentru j ; pentru j = - de la "+, la " , -" sau de la , +" la " , +" (deoarece u'(x) este o derivată, u'(x) este negativă pe măsură ce u(x) scade) Astfel, modificarea în V este - și apoi arată că exponentul pr din partea stângă a ( ) are forma Sz( - Astfel, în ( ) £ j devine £ i~ De fapt, chiar mai mult este adevărat Rețineți că algoritmul din Ex calculează ±pn(x) și T - Fie en = deg(pn) și dn = deg(pnu - qnv) În ex am văzut că dn-i + en = deg(u) pentru n > Să demonstrăm că condițiile deg(p) deg(d) + dn, deoarece acest lucru este cu siguranță adevărat dacă dn = - Altfel, dn-i + en = dn + en+i > dn + en- Astfel, deg(pu - qv) = deg(c) + dn-i Dar am presupus că deg(pu - qv) (x) - r(x ) și deg(r) = d, apoi p(x)/q(x) = pn(x)/q"(x) pentru un n" Pentru dn- > d > dn-i, există o soluție q(x) astfel încât deg(p) = en i + d - dn-i p, probabilitatea de a avea cel puțin un factor liniar este - ( - /p)p Numărul mediu de factori liniari este de p ori numărul mediu de ori când x împarte polinomul u(x), deci este +p- + +p -p = D ( p-p) [În mod similar, constatăm că probabilitatea existenței unui factor ireductibil de gradul este egală cu fc și tinde spre - e ,/ ( + |p ) + O(p~ ) ca n -> oo Numărul mediu al acestor factori este egal cu | - |p ^n^ L] Notă Fie u(x) un polinom fix cu coeficienți întregi Peter Weinberger a descoperit că, dacă u(x) este ireductibil peste inelul de numere întregi, atunci numărul mediu de factori liniari u(x) modulo p tinde spre ca p -> oo deoarece grupul Galois u(x) este tranzitiv și numărul mediu de cicluri unitare într-un element ales aleatoriu al oricărui grup de permutări tranzitive este Prin urmare, numărul mediu de factori liniari u(x) modulo p este egal cu numărul de factori ireductibili u(x) peste inelul de numere întregi ca p -> oo [Cm note în răspunsul la ex , precum și Pro Symp matematică pură (Amer Math Soc , ), - ] (a) Se știe că u(x) poate fi reprezentat ca un produs al polinoamelor ireductibile și că coeficienții conducători ai acestor polinoame trebuie să fie elemente inversabile deoarece împart coeficientul de conducere al polinoamului u(x) Prin urmare, putem presupune că u(x) are o reprezentare ca produs de polinoame ireductibile normalizate pi(x)ei ,pr(a:)e'', unde pi(x), , pr(x ) sunt diferite Această reprezentare este unică până la ordinea factorilor, astfel încât condițiile impuse asupra u(x), v(x) și w(x) sunt îndeplinite dacă și numai dacă ѵ(х) = Pi(x)lei/ J pB(x)le"/ J, w(x) = рЛх)' mod ■ • ₽,(*)'" mod (b) Funcția generatoare pentru numărul de polinoame normalizate de grad n este + pz + p z + ■■• = /( - pz) Funcția generatoare pentru numărul de polinoame de gradul n, care sunt de forma v(x) , unde v(x) este un polinom normalizat, este + pz + p z + ■ ■ ■ = /( - pz )- număr de polinoame fără pătrat normalizate de gradul n în termeni de g(z), atunci conform părții (a) din acest exercițiu /( -pz) = g(z)/(l -pz ) Prin urmare, g(z) = ( - pz )/(l - pz) = + pz + (p - p)z + (p - p )z + • ■ • Deci răspunsul este pn - pn pentru n > [În mod curios, aceasta demonstrează că u(x) L u'(x) cu probabilitate - /p; aceasta este aceeași probabilitate ca și probabilitatea ca u(x) ѵ(х) în cazul independenței lui u(х) și ѵ(х) conform ex - ] Notă În mod similar, se demonstrează că fiecare polinom u(x) poate fi reprezentat în mod unic ca v(x)w(x)r, unde v(x) nu este divizibil cu puterea a r-a nici un polinom ireductibil; numărul de astfel de polinoame normalizate v(x) este pn - pn~r+ pentru n > r Fie u(x) = Ui(x) u(x) Există cel mult un astfel de polinom ѵ(x) conform demonstrației teoremei C Există cel puțin un astfel de polinom dacă pentru fiecare j este posibil să se rezolve un sistem cu wt(z) = și wt(z) = pentru k / j Soluția acestuia din urmă este ѵi(х) uk(х), unde ѵі(х) și vz(x) satisfac relația + V (x)uj(x) = , Heg(vi) і( - după luând logaritmi, această relație poate fi rescrisă ca ln(l/(l -pz)) = Ek,>>io*pzkllj = £,->! Gp(?)/j Din enunțul indicației rezultă răspunsul Gp(z) = J m> р(т)т -Нп( /( -pzm)), din care obținem apr = E i ^n)g(zn)n~*r = g( m)n-' £nXm g(n) = g(z) [Numerele aPr au fost găsite pentru prima dată de Gauss; vezi Werke , - ] Fie Opr numărul de polinoame normalizate de gradul n modulo p care au exact r factori ireductibili Atunci Gp(z,w) = r>oanprZnwr = exP(Efc>i Gp(zk)wk/k) = exp(J m> amw ln(l/(l -pz m)), vezi formula - ( ) Avem En>o lprg" = w')/dw l"=i = (Efc>i Gp(zk/pk)) Gp^z/p, ) = (En>!ln(l/(l - p ~PgP))>p(n)/n)/( - z), deci Anp = Hn + l/ p + O(p- ) pentru n > Valoarea medie a lui r este [zn] Gp(z/p, ) = n + + (n - l)/p + O(np" ) (Totuși, varianța este o cantitate de ordinul lui n : pune w = ) Conform teoremei lui Fermat, x - s este un factor de xp - x (mod p) pentru astfel încât u(x) împarte partea dreaptă după ex - Vectorul ( ) este singurul a cărui k-a componentă nu este egală cu zero De exemplu, începând cu x și p Apoi ar trebui să setați jR [x] , polinoamele de gradul k care sunt ireductibile peste inelul de numere întregi pot fi complet factorizate în factori liniari și pătratici modulo orice număr prim Pentru gradul , a dat ca exemplu polinomul x - m + m + m + , care are rădăcinile ±\/ ± y/ ± i [vezi Matematică Comp ' ( ), - ] Conform teoremei Frobenius din ex orice polinom ireductibil de grad n al cărui grup Galois nu conține n-cicluri va avea factori modulo aproape toate numerele prime ] Cazul când p = k + : (x + ( + \/^ )D/ )(a: + ( -\/^ )/\/ )(a: - ( + \/^ )A/ )x (x - ( - y/-T)/>/ ) Cazul când p = k + : (x + i/^ m - )(x - y/ - x - ) Cazul când p = k + : (x + x/=T)(a: - \/-T) Cazul când p = k + : (x + \/ t + ) x (x - y / x + ) Expansiunea pentru p = k + este valabilă și în câmpul numerelor reale Algoritmul N poate fi adaptat pentru a găsi coeficienții w Lasă A- matrice de dimensiune (r + ) x n, al cărei k-lea rând conține coeficienții v(x)k mod u(x) pentru I cu o alegere aleatorie a lui s În practică, alegerea succesive a lui s funcționează la fel ca alegerea aleatorie a lui s, astfel încât se obține următorul algoritm: "Calculează gcd(x - u, x(p ) / - ), , (x + ) Alegeți x aleatoriu din intervalul (f) f V(f) (a) Conform lemei Gauss, pp(p (upx)) ■ • PP(Pr(unx)) De exemplu, lasa u(x) \u d x - x + x - - , v (x) \u d x - x '+ x- - \u d (x + ) (x - ); atunci pp( x + ) = ■ x + , pp( x - ■ ) = x - (Aceasta este versiunea modernă folosit de mulți ani pentru a rezolva ecuațiile algebrice ale trucului din secolul al XIV-lea ) (b) Fie pp(w(u"a:)) = wmxm + • • • + w>o = w(unx)/c, unde c este conținutul lui w(unx) ca polinom în x Atunci w(x) = (cj/u")g'l +- ■ ■ + cwo- Prin urmare, cwm = u(tm); deoarece wrn este un divizor al lui un, c este un multiplu al lui u(tm)- Dacă u(x) = v(x)w(x) și deg(v) deg(w) > , atunci uxn = v(x)w(x) modp În conformitate cu unicitatea expansiunii modulo p, toți coeficienții v și w, sunt multipli ai lui p și p divide vqWq = io- (a) ~ Wj-i)(âWj - Wj-i) = ~ âuj-i)(wj - crâj i) (b) Poate fi luat în considerare că u Φ Fie m(u) = P"=i min(l, |aj|) = |uo|/M(u) Pentru |aj| , , xn > și xi xn = M funcția elementară simetrică ■ ■ • = xn-i = și xn = M (Dacă xi /p, atunci M(u) - ||u||( + O(p)); prin urmare, c după t pași va fi egal cu M(u)( + O(p (a) Coeficientul aphqCrdB este zero pe ambele părți, cu excepția cazului p + s - q + r Când această condiție este îndeplinită, coeficientul din dreapta este (p + s)!; in stanga este [ÎN Beauzamy și J Degot, Trad amer Matematică soc ( ), - ; D Zeilberger, AMM ( ), - ] (b) Fie ap = vp, bq = Wq, cr = vr, d, = w, Atunci partea dreaptă (a) este egală cu B(u), iar partea stângă este suma termenilor nenegativi pentru fiecare j și k Dacă luăm în considerare numai termenii în care Sj este o putere a lui v, termenii vp/(p - j)! dispar cu excepția p = j Acești termeni se reduc la J! k'| = B(V)B(W>) ■ îi, JK- [B Beauzamy, E Bombieri, P Enflo și H Montgomery, J Number Theory ( ), - ] (c) Adăugarea unei noi variabile pentru a obține omogenitate nu modifică relația u = vw Astfel, dacă v și w au puteri comune de tip, respectiv, obținem (mn + n)! [și] > tp! [g] n! [w] ; cu alte cuvinte, [u][w] (m/t)!e, deoarece logr(x) este convex pentru x > ; deci |r+| (x) + qf( x ) mod qr Pentru tot t(x) avem (a(x)f(x) + t(x)w(x))v(x) + (b(x)f(x) - t(x)v(x))w(x) = f( x)modr Deoarece pentru £(v) există un modulo invers invers, putem folosi algoritmul D pentru a găsi un coeficient t(x) astfel încât deg( / - tv) oo este g(z) = ( + z)(l + |z )(l + |z ) Pentru ! zn/n + ^n>i/(*"/")) = A(z)/( - r), si se poate arata ca probabilitatea marginala este /i( ) = exp(J n> /( /n)) = e~y " De fapt, NG de Bruijn a descoperit că formula asimptotică are următoarea formă: [Cm D H Lehmer, Acta Arith ( ), - ; D H Greene și D E Knuth, Math pentru Analiza Algoritmilor (Boston: Birkhăuser, ), § ] Pe de altă parte, răspunsul pentru e + O,mp/pm) și C ~ ] Fie qi(x) și Q (x) orice divizori ireductibili ai lui q(x) Conform teoremei chineze a restului (Ex ), alegerea unui polinom aleatoriu t(x) de grad | dacă da(x) are cel puțin doi factori ireductibili și t( x ) este un polinom binar aleator de grad este impar, nu este greu de demonstrat că Fn(m) = Fn(-x) Dacă p împarte n, a doua identitate din (a) arată că Fp(x) = Fp(x₽) Dacă p nu împarte n, atunci avem Pentru compusul n divizibil cu p Adevărat dacă p > deg(u) [cf ex ] [DYY Yun, Proc ACM Symp Comp simbolic și algebric ( ), - ] Set (i(x),w(x),w:(x)) h-CSP(m(x),m'(x)) Dacă t(x) = , se stabilește e h - ; în caz contrar, setați (гіі(g), іі+i(g), rі+i(g)) h - CCO(gJ), gіJ) - u[(g)) pentru r = , , , e - până când noi (x) - r;' (x) = În cele din urmă, stabiliți ue(x) h- ѵe(x) Pentru a demonstra corectitudinea acestui algoritm, observăm că calculează polinoamele u,+ (g) și goJ) = w(w)w+ (w)w+ (w) + u,(w)u'+ (w)gі,+ (w) + w(w) w+i(g)u'i+ (g) + • ■ • Avem +i(x) și vj(x) = vj(x)vj+i(x) [Yun observă că timpul de funcționare al descompunerii fără pătrat prin metoda ex este de cel mult de două ori timpul de calcul pentru gcd(u^),u'(x)) În plus, dacă având în vedere o metodă arbitrară de descompunere fără pătrat, metoda din acest exercițiu duce la o procedură pentru găsirea celui mai mare divizor comun (În cazul în care u(x) și v(x) sunt fără pătrați, cel mai mare divizor comun al lor este pur și simplu Wi(x), unde w(x) = u(x)v(x) = Wl(x)w ( x) -, toți POLINOMII Uj(x), Vj(x), Uj(x) și Vj(x) sunt fără pătrat ) Prin urmare, problema transformării unui polinom primitiv de gradul n în pătratul său- reprezentarea liberă este echivalentă din punct de vedere computațional cu problema găsirii celui mai mare divizor comun a două polinoame de grad n în sensul timpului de rulare asimptotic în cel mai rău caz ] Fie U,(x) valoarea calculată pentru "mJ)" conform procedurii din ex Dacă deg(J i) + deg(J ) + • • • = deg(tz), apoi mJ) = U,(x) pentru tot j Cu toate acestea, în cazul general, vom avea e +RJ), astfel încât individul mJ poate fi calculat ) prin formula gcd(J j (x), zk(x)) = Uj + Pk(x) pentru (ajp/p-')>lJ/kj\, unde kj este numărul de dj egal cu j Întrucât, conform ex a]p/p " /J, obținem formula din exercițiu - Note Din acest exercițiu rezultă că dacă fixăm un număr prim p și alegem aleatoriu un polinom m(x), atunci va exista o anumită probabilitate de extindere modulo p în modul specificat O problemă mai dificilă este determinarea probabilității pentru un polinom fix m(x) și un număr prim "aleatoriu" p, ceea ce duce la același rezultat asimptotic pentru aproape toți m(x) G Frobenius a demonstrat în (deși rezultatul nu a fost publicat până în ) că polinomul întreg m(x) este factorizat modulo p în factori de grad di, ,dr cu un prim mare p ales aleatoriu cu probabilitate egală cu numărul de permutări din grupul Galois G de polinoame m(x) care au lungimi de ciclu {di, ,dr} împărțit la numărul total de permutări din G [Dacă m(x) are coeficienți raționali și rădăcini diferite £i, , £n peste câmpul numerelor complexe, grupul său Galois este singurul grup de permutare G astfel încât polinomul Pr(i) p(n)gG (z + Cp(i)Yi + • • • + Cp(n)Yn) = U(z,yi, ,yn) are coeficienți raționali și este ireductibil în câmpul numerelor raționale; vezi G Frobenius, Si'tzungs-berichte Konigl rgeiv Akad Wiss (Berlin, ), - Maparea liniară x x -> xp este denumită în mod tradițional automorfismul Frobenius, ca și în celebra sa lucrare ] În plus, B L van der Waerden a demonstrat în că aproape toate polinoamele de gradul n au mulțimea tuturor n! permutările ca grupul lor Galois [Math Annalen ( ), - ] Prin urmare, aproape toate polinoamele fixe ireductibile m(x) vor fi factori, așa cum ar fi de așteptat, în ceea ce privește alegerea aleatorie a unui număr prim mare p [Cm Vezi şi N Cebotarev, Math Annalen ( ), care prezintă o generalizare a teoremei Frobenius pentru clasele conjugate de grupuri Galois ] Din condiţiile rezultă că atunci când |r| = , avem fie |wn- ^n + • • ■ + Mo| Prin urmare, singura posibilitate este ca v și w ambele să aibă exact o astfel de rădăcină și că un- i = Aceste rădăcini trebuie să fie reale, deoarece rădăcinile sunt numere complexe conjugate Prin urmare, u(z) are o rădăcină reală zq cu |th| > Dar aceasta nu poate fi, deoarece, dacă r = I/zo, avem = | + mp- r -I bmo"| > +un- r - |mp-z|g -|"o|gn > [DESPRE Perron, Crelle ( ), - ; generalizările sunt date în A Brauer, Amer J Math ( ), - , ( ), - ] Să demonstrăm mai întâi afirmația din indicație Fie polinomul u(x) = a(x-ai') ■ (x-an) are coeficienţi întregi Rezultanta polinomului u(x) cu polinomul yt(x') este determinantul, deci este polinomul rt(y) = adeg(t)(jf - t(ai)) (y - t (an)) cu coeficienți întregi (vezi exercițiul - ) Dacă m(x) împarte v(t(x)), atunci u(t(ai)) = Prin urmare, rt(y) are un factor comun cu v(y) Deci, dacă ѵ este ireductibil, avem deg(u) = deg(rt) > deg(v) Pentru un polinom ireductibil dat m(x), pentru care este necesară o scurtă demonstrație a ireductibilității, putem presupune că este normalizat conform Ex , și de asemenea să presupunem că deg(u) > Ideea este de a arăta existența unui polinom t(x) astfel încât polinomul v(y) = rt(y) să fie ireductibil după criteriul exercițiului Atunci toți factorii m(x) împart polinomul v(t(x)), iar acest lucru demonstrează că u(x) este ireductibil Dovada va fi "scurtată" dacă coeficienții t(x) sunt suficient de mici Se poate arăta că polinomul v(y) = (y - / i) (y - / n) satisface criteriul ex dacă n > și /Зі /Зп / și dacă următoarea "condiție de micime" este îndeplinită: / ;I n| (ai, ,an-i)| ( nB)n , trebuie să existe vectori diferiți (ao, • , an-i) și (bo, ,a'n i) astfel încât | nS, (ao, , an-i)J = | nS,(ao, , a" i)] pentru , dacă există SECȚIUNEA xm, unde m = L|gnJ este cea mai mare putere a lui mai mică sau egală cu n Să presupunem că valoarea de intrare x este în registrul A, iar n este în memorie la adresa NN; valoarea de ieșire este plasată în registrul X AI ENTX AI Inițializare STX Y Y h- STA Z Z h LDA NN N JAP F Treceți la pasul A JMP DUNE În caz contrar, răspunsul este H SRB L + l - K STA NL + l - K U h - [U / ] A LDA ZL A Z pătrat MUL ZL Și STX ZLZ H - Z x Z mod w A LDA NL A Împărțind N în jumătate H JAE B L + l Treceți la pasul A dacă N este par SRB K A JAZ F K Tranziție dacă N = STA N K- Uch- [U / ] AZ LDA Z K- AZ Înmulțiți Y cu Z MUL Y K- STX Y K- Y h - Z x Y mod w JMP A K- Treceți la pasul A H LDA Z MUL Y Înmulțire finală | Timpul de rulare este L + K + , unde L = A(n) este cu unul mai mic decât numărul de biți din reprezentarea binară n și K = u(n) este numărul de biți din această reprezentare Pentru un program secvenţial, putem presupune că n este suficient de mic pentru a se potrivi în registrul index; în caz contrar, exponentiația succesivă este în afara domeniului acestei sarcini Următorul program pune valoarea de ieșire în registrul A S LD NN rll -n STA X Xw JMP F H MUL X Nl rA x X mod w SLAX Nl -> rA H DECI N rll - rll - J P B N Înmulțiți din nou dacă rll > Timpul său de funcționare este de U - ; acest program rulează mai repede decât precedentul pentru n Secvențele exponente pentru aceste metode sunt: (a) , , , , , , , , , , , , , , , , [ înmulțiri] ; (b) , , , , , , , , , , , , , , [de ori]; (c) , , , , , , , , , , , , , [de ori]; (d) , , , , , , , , , , , , , [ înmulțiri] [Cel mai mic număr posibil de înmulțiri este ; se poate se obține prin combinarea metodei multiplicatorului cu metoda binară, deoarece = ■ ( e + ) ] ( ) = - TI [Inițializare ] Setați LINKUfj] h- pentru ei > • ■ ■ > et > este șirul , , , , e°, e° + ' , , e° e ×- - e' In afara de asta, succesiunea exponenților la fiecare nivel este sortată în ordine lexicografică descrescătoare Metoda binară și metoda multiplicatorului necesită un pas mai mult când se calculează x n decât când se calculează m"; metoda arborelui puterii necesită nu mai mult de un pas suplimentar Prin urmare, (a) ■ k; (b) • * (c) • k, k = , , , , Un arbore de grade include întotdeauna un nod mn cu un nivel sub mn, cu excepția cazului în care a fost deja întâlnit la același sau la unul dintre nivelurile anterioare; in plus, arborele include intotdeauna un nod m - - la un nivel sub nodul m, cu exceptia cazului in care se afla la acelasi nivel sau la unul dintre cele precedente [Nu este adevărat că m este un nod copil m în arborele de grade pentru toți m; cel mai mic exemplu în care nu este cazul este mn = , care apare la nivelul , în timp ce nodul apare la nivelul în altă parte De fapt, m apare uneori chiar și la același nivel cu m; cel mai mic astfel de exemplu este mn- ] Să începem cu setările W -n, Ich-іuU, - pentru , setăm k - N modm, W - [A/m] Apoi, dacă k = , setați Z h - Zm și repetați pasul; în caz contrar, dacă k = pq, unde q este impar, setați Z ch - ZiP, Yq ch - Y, • Z și, dacă N > , setați Z ch - Z ' F și repetați pasul Și, în sfârșit, setăm Yk h - Yk • Uc- pentru k \u d mn - , mn - , , Răspunsul dorit este de ) Aplicați reprezentarea PARENT discutată în secțiunea : utilizați un tabel P[J] > (Faptul că fiecare nod al acestui arbore are gradul cel mult doi nu afectează performanța reprezentării Nu face decât să îmbunătățească aspectul arborelui folosit ca ilustrație ) , , , , , , ( sau ), ; , , , , , , ( sau ), ; , , , , , , , ( sau ), ; , , , , , , , ( sau ), Dacă oricare dintre ultimele două căi ar fi în arbore, n = ar fi imposibil, deoarece arborele trebuie să conțină fie , , , sau , , , , Un astfel de arbore este imposibil, deoarece (rі) / *(rі) pentru niște n Pentru cazul , utilizați un lanț de tip urmat de A+C + B+C + A + B sau utilizați metoda multiplicatorului Pentru cazul , utilizați un șir de tip urmat de L+S+ + B+S + A + B Pentru cazul , utilizați fie un șir ca urmat de A + L , fie metoda multiplicatorului Pentru cazul , n = ■ °, deci se poate folosi metoda multiplicatorului (a) Este ușor de observat că pașii r - și nu sunt mici Acest lucru ne permite să considerăm că pasul r - este mic, dar pasul r - nu este Dacă c = , atunci A(ar i) = X(am-k), astfel încât k = ; și întrucât , făcând pasul r - stea -în formă (astfel încât lanțul ao, ai, , ar-z, am-i să nu cuprindă doar un pas mic) Atunci ar-i = am- + ar~h pentru unele q, iar dacă înlocuim ar , ar i, ar cu ar , ar-r, ar-r + ar q = ar, obținem un alt lanț-contraexemplu în care pasul r este mic Cu toate acestea, acest lucru nu este posibil Pe de altă parte, dacă c > , atunci , astfel încât i/(ar *,) + p(ar i) > conform ( ); prin urmare, atât i/(ar-i:) cât și i/(ar i) sunt ambele > Toți pașii mici trebuie să fie , este necesar să aibă c = , k = , i/(ar i) = v(ar-i) = Astfel, ar i > m+ m" + m nag-i trebuie să fie egal cu m + m + m + m , dar din ar > |ar i rezultă că ar i = sar- - Prin urmare k = și ar-i > m + m~ Deoarece ar , r - este o treaptă stea și de la ar = ar- + ar trebuie să rezulte că ar- = m~ De aceea, este necesar să se obțină ar = ar + ar- Ca și în cazul similar considerat în textul secțiunii, singura posibilitate este să se execute ar- = m- + m- ; Or (tm)- + m" + d+ + d, ar i = m + m~ + d+ + d+ , dar și acest lucru este imposibil Achim Flammenkamp [Diplomarbeit in Mathematics (Bielefeld University, ), Part ] a arătat că toate numerele n cu A(n) + = l(ri) B>C>D>EnB + E = C + D; în plus, ele sunt descrise exact ca nu se potrivesc cu niciunul dintre cele opt modele (aici |e| B + ), L -p B + e + b + s + e l - C + e l /v(n) = A(n) + p(n) - , deci dacă n = k, Іv(rі) / X(rі) = , dar dacă n = k + - , /B (n)/A(n) = Fie ii ca m -> oo un polinom liber în m este "bun" Produsul funcțiilor bune este o funcție bună Dacă g(rn) -> și c este o constantă pozitivă, atunci este o funcție bună; bine este de asemenea Acum înlocuim fiecare termen al sumei cu termenul maxim în s, t, ѵ Numărul total de termeni este bun, la fel ca și ( ^ )' Ct") Și în final ((m+l) ) }); (Afoi, , Mri) = ( , , , , , , {A + C- }, , {A+C+ £>- }) , Si = МіойМіі Fie, de exemplu, u = ?+ , x = ( ('+ )u - )/( U - ) = "" + ■ • -+ " + , y = ( "+ )" + Atunci xy = ( " - )/( " - ) Dacă n = (?+ '" + xy, avem (n) - )/(B- ) pentru a, > aj + ak = a, Prin urmare, Aj ⊂ Aj-i și Ak ⊂ Ai-i/ di~dk (c) Inducție simplă pe i, dar pașii apropiați necesită o atenție mai mare Vom spune că m are proprietatea P(a) dacă toți cei din reprezentarea sa binară sunt localizați în blocuri consecutive > a la rând Dacă um' are proprietatea P(a), atunci la fel are mVm'; dacă m are proprietatea P(a), atunci p(m) are proprietatea P(a + a În consecință, p(p(t)) , lgi/(n), atunci s > Igi'(n), după cum este necesar, în conformitate cu ( ) În caz contrar a; Ign + br - br lg(l + r) > Ign + Igi'(n) - lg(l + cr) - rlg(l + ~s) Fie lgn+lgi/(n)-lg(l+( gi'(n))|'lg(l+ gi'(n))'|) [TheoreticaJ Comp sci ( ), - ] În lucrarea tocmai citată, Schönhage a îmbunătățit metoda din ex pentru a demonstra că l(n) > Ign + lgn(n) - pentru toate n Se poate închide decalajul rămas? n = este cel mai mic exemplu; ( ) = , dar lanțul cu adunare și scădere , , , , , , are lungimea lanțuri de scădere Schönhage a extins limita inferioară de la Ex în lanțuri cu adunare și scădere cu n(n), înlocuite cu P(n), așa cum este definit în exercițiu - O metodă de exponențiere binară generalizată de la dreapta la stânga care utilizează înmulțirile A(n)+P(n) - când sunt date atât x, cât și x- se poate baza pe reprezentarea lui an din acest exercițiu ] Vezi Matematică discretă ( ), - [Acest model de preț corespunde înmulțirii numerelor mari printr-o metodă clasică similară algoritmului M Rezultatele empirice cu un model mai general în care prețul este (ajOk)^ au fost obținute de D P McCarthy, Math Comp ( ), - ; acest model este mai aproape de metodele de "înmulțire rapidă" din secțiunea , unde două numere de n biți sunt înmulțite în pași O(n/ ), dar funcția de cost aja^ este de fapt mai potrivită (vezi exercițiul - ) X Zantema (H Zantema) a analizat o problemă similară cu costul pasului i egal cu aj + ak, și nu a}ak (vezi J Algorithms ( ), - ) În acest caz, lanțurile optime au un preț comun |n + O(n ,/ ) În plus, cea optimă prețul aditiv pentru n impar nu este mai mic decât |(n - ); este egală cu această valoare dacă și numai dacă n poate fi scris ca produs de numere de forma k + ] Opt; patru căi de calcul = + + + și două căi de calcul = + + Afirmația este adevărată Semnele din graficul dat al lanțului binar sunt [n/ k] pentru k = eo, , ; în graficul dual ele sunt egale cu , , , '°, n [În mod similar, metoda m-ary "de la dreapta la stânga" din exercițiu este dual în raport cu metoda "de la stânga la dreapta"] Un șir binar este echivalent cu f șiruri; acest număr trebuie să fie t dacă e = ei + Numărul de lanțuri echivalent cu schema algoritmului A este egal cu numărul de căi pentru calcularea sumei t + numere, dintre care două sunt aceleași Această valoare este egală cu |/t+i + |/t, unde fm este numărul de moduri de a calcula suma m + l numere diferite Având în vedere comutativitatea, vedem că fm este egal cu ~m ori (m + )! ori numărul de arbori binari cu m noduri, deci fm = ( m-l)( m- ) l Să construim m - m - produse x' xe(tm) pentru fiecare succesiune de puteri astfel încât Fie rik = (dkx - dkidko )?-Pentru a finaliza calculul, găsiți x^ X xn(tm)x, apoi pătrați și înmulțiți cu x*II x^ pentru i = A - , , , [ Straus a arătat în AMM ( ), - că A(n) poate fi înlocuit cu ( + e)A(n) pentru orice e > prin generalizarea acestei metode binare la k-ary, ca în teorema D ] Mai întâi se calculează q pentru , ( , , m ) > m + m ?/ e pentru m suficient de mare [SICOMP ( ), - ] Valoarea ([nі, n , , nm]) este egală cu minimul valorii arce - vârfuri + m, preluate toate graficele direcționate care au m vârfuri Sj ale căror grade de intrare sunt egale cu zero și un vârf t cu grad de ieșire zero, unde există exact nj căi direcționate de la s la t pentru m Deoarece acesta este un polinom în m și deoarece problema găsirii acoperirii minime a vârfurilor este NP-hard (vezi Secțiunea ), problema calculării (n, , n) este NP-complet [Nu se știe dacă problema calculării (n) este NP-complet Cu toate acestea, este destul de plauzibil ca lanțul optim pentru, de exemplu, Eb n*:+i AÂ! va duce la apariția unui lanț optim pentru {n, , n} pentru A suficient de mare ] SECȚIUNEA Atribuiți y s > j > Punând m = n = s și j ss Ign, obținem că acest număr este egal cu , n - jnlgn + O(n) Cea mai bună limită superioară cunoscută pentru n mare a fost discutată în secțiunea de după formula ( ) Însumând seria geometrică, aflăm că F(ti, ,tn) este egal cu Eo • • • i ,tn fc) când (si sn) - (si s'n) = prin modulo n Aproximativ jumătate din înmulțiri și adunări sunt la fel de necesare ca și pentru numerele complexe [Algoritmul Fast Fourier Transform a fost descoperit de C F Gauss în și apoi descoperit independent Cel mai interesant este că acest lucru a fost făcut de JW Cooley și JW Tukey, Math Comp ( ), - Istoria sa interesantă a fost urmărită de J W Cooley, P A W Lewis și P D Welch (JW Cooley, P A W Lewis și P D Welch, Proc IEEE ( ), ) - ); M T Heideman, D H Johnson și C S Burrus, IEEE ASSP Magazine , (octombrie, ), - Detaliile legate de aplicarea sa au fost discutate de sute de autori; această discuție a fost rezumată foarte pe scurt de Charles Van Loan (Charles Van Loan, Computațional Frameworks for the Fast Fourier Transform (Philadelphia: SIAM, )) Pentru o trecere în revistă a transformării rapide Fourier pe grupuri finite, a se vedea M Clausen și U Baum, Fast Fourier Transforms (Mannheim: Bibliographisches Institut Wissenschaftsverlag, ) ] (a) Indicația rezultă din integrare și inducție Fie / - a = , a = - , ai = , / i = - , Pr = - , P = - , / = , a - - , a = , = , az - - Formăm z = (x - )x + , w = z + x și u(x) = ((z - x - )w + )z - Una dintre cele șapte însumări poate fi salvată prin calculând w = x + , r = u - x (a) Se poate folosi inducția pe n; rezultatul este banal dacă n pentru care ci apare în ); adăugați /Zr,- / la i și setați i-i egal cu zero Setul de rezultate nu se va modifica după această eliminare a i-i, cu excepția valorilor ai, , a , astfel încât i este egal cu zero [Această dovadă a fost propusă în esență de V Ya Pan, Uspekhi mat Nauk , (ianuarie-februarie, ), - ] Ultimul caz poate fi considerat, ca și în demonstrația Teoremei A, deoarece polinoamele cu = pot fi calculate prin eliminarea i (ca în prima construcție) , unde /c corespunde înmulțirii parametrilor) În caz contrar, se poate adăuga o înmulțire a unui parametru ca ultim pas și se poate ajunge la o contradicție a teoremei C (Acest exercițiu este o îmbunătățire versiunea teoremei A în acest caz particular, deoarece există doar n grade de libertate pentru coeficienții unui polinom normalizat de gradul n ) Ai = Ao x Ao, Aa = ai x Ai, Az = ar -Az, A = Az x Ai, As = az -A Sunt necesare cel puțin trei înmulțiri pentru a calcula u x (vezi Secțiunea ) și cel puțin două adunări prin teorema A Este necesar să avem n - și cu [n/ ] - (posibil complexe) înmulțiri [SICOMP ( ), - ] Ea a mai arătat că atunci când n = este posibil să se realizeze [r/ ] - înmulțiri, dar cu cel puțin n - adunări Apropo, au dispărut destul de multe operații de adăugare (vezi exercițiul ), clauzele "aproape toate" și "eventual complexe" V Ya Pan [STOC ( ), - ; IBM Research Report RC ( )] a găsit circuite cu [n/ j - înmulțiri complexe și un număr minim n + + Sno de înmulțiri complexe adunări pentru toate imparele n > Metoda lui pentru n - este v(x) = ((x - a) -fa)(x - ), w(x) - v(x) - x, rămâne necunoscut a(c -d)-(a -b)d -i(a(c -d) -(b-a)c) [Atenție la instabilitatea numerică Sunt necesare trei înmulțiri deoarece în cazul particular ( ) cu p(u) = u - înmulțirea este complexă Fără restricția de adăugare, există și alte posibilități De exemplu, în , Peter Ungar a propus formula simetrică ac - bd + i((a + b)(c + d) - ac - bd) Egalitatea -( ) este similară cu c " ca r Vezi și I Munro, STOC ( ), - ; S Winograd, Linear Algebra and its Applications ( ), - ] În schimb, dacă a -b = și t = ( - a)/b = /( -a), atunci pentru a calcula produsul Oscar Buneman a propus algoritmul "w = c - td ѵ = d -biv, u = w - tv" [J Comp Fiz ( ), - ] Prin această metodă, dacă a = cov și b - sin#, obținem t = tan(#/ ) Helmut Alt și Jan van Leeuwen [Computing ( ), - ] au arătat că sunt necesare patru înmulțiri sau diviziuni reale pentru a calcula /(a - bi) și patru operații sunt suficiente pentru calcule a a (c/b) a b - cі b - c (c / b) b - c (c / b) Șase operații de înmulțire-împărțire și trei de adunare-scădere sunt necesare și suficiente pentru a calcula (a - bі) / (c - di) [T Lickteig, SICOMP ( ), - ] În ciuda acestor limite inferioare, trebuie amintit că nu este necesar să se efectueze aritmetică complexă în ceea ce privește aritmetica reală De exemplu, atunci când se folosește transformarea rapidă Fourier, timpul necesar pentru înmulțirea a două numere complexe cu n cifre este asimptotic doar de aproximativ dublu față de timpul necesar pentru înmulțirea a două numere reale cu n cifre (a) Fie mr, , mrm A, corespunzătoare înmulțirilor din lanț, apoi mr, = Ріі-і x Р І și u(x) = Prm + i, unde fiecare Pj are forma D + faox + faiiri -bgDe r(j) Această formă canonică simplă include parametrii m - m Deoarece aj parcurge toate valorile întregi și la fel cum parcurgem toate lanțurile, așa fa trece prin cel mult m + m seturi de valori modulul Prin urmare, setul de rezultate este același Pentru a obține toate cele n polinoame de gradul n cu - coeficienți, m - m > n trebuie să se țină (c) Atribuiți m m -■ • • -Ui(ar)xm -uo(r), unde fiecare uj(x) este un polinom de grad , care necesită * - înmulțiri suplimentare și l + L + I - adunări Dacă n = ', atunci putem aplica regula lui Horner pentru a micșora n cu Și dacă m - dacă n este suficient de mare ] Este suficient să arătăm că rangul lui (Ty*) nu este mai mare decât rangul lui (tijk), întrucât se poate obține (tijk) din (T^k) transformându-l în același mod cu F" , G~l, H~ y Dacă tijk = (T=i aubjtCkt, atunci rezultă imediat că Tu* - (o?) sau , în funcție de câți factori ireductibili are polinomul u - u - q (unu sau doi) în domeniul care ne interesează (vezi ( )) Un tensor de dimensiunea m x n x s are mns grade de libertate Potrivit ex toți tensorii de dimensiunea m x n x s pot fi exprimați în termeni de (m + n + s)r elemente de realizare (A, B, C), cu excepția cazului în care (m + n + s)r > mns Pe de altă parte, să presupunem că m > n > s Rangul maxim al unei matrice de dimensiunea m x n este n Astfel, orice tensor poate fi obținut în ns înmulțiri într-un lanț, obținându-se fiecare matrice separat [În ex arată că un astfel de infim pentru rangul maxim al unui tensor nu este cea mai bună limită posibilă și o limită superioară Thomas D Howell (teză de doctorat, Corneli Univ , ) a arătat că există tensori cu rang > [mns/(m + n + s - ) peste numerele complexe ] Dacă (A, B, C) și (A', B', C') sunt realizări ale lui (tijk) și respectiv (t'^k) de lungime r', atunci A" = A(r) A', B" = B(r) B', C" = C (r)C și A!" = A (r) A', B'" = B (r) B', C" = C(r)C sunt realizări (t"jk) și (i"\) de lungime r + r' și, respectiv, r ■ r Cometariu Mulți, desigur, presupun că rang((іchd,) f (t'ijA,)) = rang(tijk) + rang(t'jfc), totuși, în ex , (b) și arată că acest lucru pare mai puțin plauzibil decât pare Conform Lemei T rank( , *,) > rank(ti(jk))- Invers, dacă M este o matrice de rang r, atunci poate fi transformată folosind operații cu rânduri și coloane, găsind astfel de non- matricele singulare F și G că matricea FMG va conține toate -urile cu excepția r elementelor diagonale egale cu (vezi algoritmul N) În consecință, rangul tensorului FMG m În schimb, întrucât (tijk) are doar m elemente nenule, acesta este evident că , rangul său vectori coloană diferiți, deoarece acesta este echivalentul înmulțirii matricelor de dimensiune (n x s) și (m x n)) (a) Sj = y + yi, s = yo - yi, ti = |(n + xi)si, m = |(n - xi)s -, w = mi + m , wi = mi - m (b) Iată câțiva pași intermediari folosind tehnica din secțiune: ((x - x )(yo - yy) -(xi - x )(yi - yi)) + ((i - y )(y - Yi) - (ii - yo)(yi - yo)) și Prima implementare - / О \ / О \ / \ , , I I x i \ О I / \ О I / \ / A doua implementare este / \ - / О \ / О \ I ) x i I О ОI, ] \ / \ / \ I І/ În final, algoritmul calculează з = уо + уй, з = уо - уй, зз = у - уо, = у - уй, se = зі + г/ ; mi = |(ya + yai + ya )z , t = |(yao + yai - ya )z , t = |(yao - yai + ya )zz, GHC = |( - а? + Хи + £ ) ; tl = mi + , t? = ГП - , t = + , WQ = tl - l , W = e Reprezentați numerele { , ,mn} ca a'pk (modulo mn), unde O [ + J=° (modulo n(k + /))] Γ(a p'), deoarece este egal cu £xww (însumarea nor + s = r(modulo n(k + ))) Transformata Fourier se obține prin însumarea /w corespunzătoare [Cometariu Când se formează combinații liniare ale lui xi, ca, de exemplu, în ( ), rezultatul va fi pur real sau pur imaginar dacă convoluția ciclică este construită conform regulii ( ) cu wn(fc) - = (un '/ + Acest lucru se datorează faptului că operația modulo (un^k^ - ) dă un polinom cu coeficienți reali + w~J, în timp ce operația modulo (un(k^ + ) dă un polinom cu coeficienți imaginari w - w~ ] Când p = , se utilizează o construcție similară folosind reprezentarea (- )'a *: (modulo mmi), unde )sr, me = • F(b), m? = ■ ; to = mi + te, tl = to + , t - GP + , t = to - , ti = PI - P , t = tl + t , te - t + ti, tr = tl - t , te - t - ti, tg = smolder + mj Notati inmultirile cu unu in acelea si ttі? Este clar ce este real înmulțirea nu este necesară aici Cu toate acestea, datorită notării acceptate, acest caz este remarcat În plus, este utilizat pe scară largă în constructele recursive Aici tv = fooi, mr = /oio, j KjkXiXj pentru toți k Dimpotrivă, fie a l-a înmulțire în lanț de polinoame pentru )(EJ bji £j), deci lanțul definește un tensor (i^b) de rang m-, în caz contrar tj]k = Atunci rang(my)c) + rang(t,,*,) > rang(fyit), deoarece obținem realizarea (tijk) ștergând ultimele n rânduri ale matricei A și primele m rânduri ale matricei B în realizarea (A, B, C) (Tijk + Tjik)- Fie N cea mai mică putere a lui mai mare decât n și fie v"+i = • ■ • = vn ! = Dacă Us = StLo și V = StLo*w *vi Pentru B și m p Cometariu În special, atunci când se lucrează într-un câmp cu elemente, se spune că șirurile A modulo formează un "cod liniar" de m vectori la cel puțin n, de fiecare dată când (A, B, C) este o realizare constând în întregime din numere întregi Aceste observații, date în RW Brockett și D Dobkin, Linear Algebra and its Applications ( ), - , Teorema ; Lempel și Winograd, IEEE Trans IT- ( ), - ; Lempel, Seroussi și Winograd, TheoreticaJ Comp sci ( ), - pot fi utilizate pentru a obține limite inferioare non-triviale pentru rândurile matricelor întregi De exemplu, M R Brown (M R Brown) și D Dobkin (D Dobkin) [IEEE Trans C- ( ), - ] a folosit acest lucru pentru a arăta că realizările de n x n înmulțiri de polinoame în numere întregi trebuie să aibă rang > an pentru toate n suficient de mari când a este orice număr real mai mic decât numărul atіn = , +; aici amin = l/hf(sin ,cos ), unde H(p,q) = plg(l/p) + glg(l/ An - [n/ J "+ + l'l/ J+ Arp/r] + ([n/ J + l) n+ + n, = L"/ J+ir>rn/ l + (L i/ j+l) n+ HM,l = L"/ J+iMrn/ Soluție are forma Aici Sn satisface formula recursivă Si = , Sn - S-n / + Ln/ J și este ușor de demonstrat inegalitatea | zi [Ign] Algoritmul C face aproximativ aceeași treabă ca algoritmul N (a) În suma Ei, de exemplu, se pot grupa toți termenii care au valori comune ale lui j și k într-un singur termen triliniar; aceasta va da p termeni triliniari atunci când (j,k) G ExE plus p când (j, k) G ExO și p când (j, k) G OxE Când j = k, numărul -x ]y r^ poate fi de asemenea ușor inclus în Ei [Pentru cazul în care n = , metoda de înmulțire a matricei x dă înmulțiri necomutative; aceasta este aproape la fel de bună ca șapte înmulțiri Makarov de matrice x (metoda menționată în răspunsul la exercițiul ), deși schema lui Winograd ( ) folosește doar când comutativitatea este permisă Într-o schemă similară, Pan a arătat că, pentru început, M(n) ud' + O(ud'+ ) Apoi R g g g cfenC(nfc')L = + O(ud+d + ) L = = m = ln = Rangul este conform metodei de demonstrare din teorema W cu P = (° J) Marginea rangului nu poate fi egală cu , deoarece este imposibil de obținut și ai(u)b (w)ci(u) = ai(u)bi(u)c (u) = modulo wd+ Marginea rangului este deoarece realizările sunt (' J), ("°), (J "*) Rețineți că fațeta de rang a fost introdusă în Bini, Capovani, Lotti și Romani, Information Processing Letters ( ), - (a) Fie elementele T(m,n,s) și T(M, N, S) să fie notate cu și respectiv Fiecare element al sumei directe, unde T \u d \u d (j, J) și K \u d (k, K) sunt egale prin definiție; deci este egal cu [T = I și J' = J și K' = /C] (b) Aplicați ex , (e) cu M( /V) = hapkn(T(A\NN)] (c) Avem M(mns) Pentru toate e > există N cu M(N) , atunci există o constantă întreagă ce astfel încât M(p) obținem th = φ* (^)T(mkMh~k,pcNh~k, skSh~k) și ranklt' ! '/ , obținem (D'*"'"' ^pyqkQh-k ch/l'u,+e'l u,cerh Prin urmare (q+Q)h (d) Lăsați ex m = n = și rețineți că ' + , > (a) O matrice mn x mns ( )) de dimensiunea mn x mns are rangul mn deoarece este o matrice de permutare când sunt mărginite m rânduri pentru care k = k' = (b) este în esență (ti(jk)) Φ (^(jjcj) plus n's + sn' coloane suplimentare zero [În mod similar, obținem ((£ (r) t')i(jk)') = -)) (r) ( ^f(jfc)) Pentru produse directe ] (c) Fie D o matrice diagonală diag(di, ,dr) astfel încât ADBT = Din lema T se știe că rang(A) = m și rang(B) = n, deci rang(AP) ) = m și apk(PBr) = n Fără pierderea generalității, putem presupune că primele m coloane ale matricei A sunt liniar independente Deoarece coloanele lui B aparțin spațiului gol AD, putem presupune, de asemenea, că ultimele n coloane ale matricei B sunt liniar independente Scriem matricea A ca o partiție (Ai Ar Az), unde Ai este o matrice de dimensiunea m x m (și nedegenerată), Ag este de dimensiunea m x q și Az este de dimensiunea m x n Să împărțim D astfel încât AD este ( AiDi A D A D ) Atunci există o matrice W = ■ (W'i IO) de dimensiune q x r, astfel încât ADW = , adică Wi = -D AqA^tD^ În mod similar, putem scrie В = (Ві Вг Вз) și găsim VDBT = О, când V = (ОіВз) este o matrice q x z cu Vз = - D B В ГD Rețineți că UDVT = D Astfel afirmarea indicației este mai mult sau mai puțin stabilită (la urma urmei, a fost doar o indicație) Să presupunem acum că ac(u) = ac pentru m][j > n] dacă k = s + [ În acest dovadă, nu va fi nevoie să presupunem că i este nedegenerat în raport cu C-] (d) Se consideră următoarea realizare a lui T(m, , n) cu r = mn + : au = [[Z/nj = i - ], bji = [Zmodn =J], b^i = [Z = (i - l)n + j], dacă Z =/] m][ j > n] dacă k = s + [Notă Prin urmare, rezultatul (e) este valabil pentru orice câmp dacă rangul este înlocuit cu rang deoarece se pot alege ak și / ,-polinoame de forma + O(u) ] (h) Fie rândul p al matricei C să fie atribuit componentei T( , , ) Principalul punct este că ac(u)bp(u)cpi(u) este zero (nu doar O(ud+ )) pentru tot i și j rămas după eliminare În plus, cp/(u) / pentru tot I Aceste proprietăți sunt valabile pentru construcțiile Secs (c) și (g) și rămân valabile și pentru produsele directe (i) Demonstrația se generalizează pur și simplu la polinoame în două și mai multe variabile (j) Punctul (h) implică inegalitatea Pătratul dă rang(T( ) (r) T( , , ) (r) T( , , ) (c) T( , , ) (c) T( , , ) (r) T( )) n Fiecare element h al matricei este reprezentat ca suma Lo + Li + • ■ • + Ln > unde h este valoarea unui polinom omogen de gradul k Atunci fiecare pas de adunare duce la n + adunări și fiecare pas de înmulțire duce la " |n înmulțiri și " |n adunări În plus, fiecare diviziune este o cantitate de forma + hi + • • ■ + hn, deoarece toate diviziunile din construcția recurentă sunt diviziuni cu când yij este complet zero; prin urmare, împărțirea este puțin mai simplă decât înmulțirea (vezi -( ) unde Vo = ) Deoarece ne oprim atunci când dimensiunea determinantului devine x , nu este nevoie să scădem din yjj când j > n- Se pare că, dacă scăpăm de calculele redundante, această metodă va necesita (?)-b ( )-I- (") - (j) + n- înmulțiri și (") + Q) + ( ) + Q) - n adunări, adică |n - O(n ) operații O metodă similară poate fi folosită pentru a elimina diviziunea în multe alte cazuri (vezi Crelle ( ), - ) (Totuși, în exercițiul următor se construiește o construcție care este chiar mai rapidă decât schema fără diviziune pentru determinanți ) Să presupunem că A = X - x, B = -u, C = -vhD = XI - Yb în egalitatea indicată, apoi calculați determinantul ambelor părți, folosind faptul că I / X + Y / X + Y / A + ■ • este inversă cu D ca o serie formală de puteri în /A Este necesar să se calculeze uYkv numai pentru Dacă s este indicele de înmulțire a matricei în exercițiu , atunci aceeași aproximare conduce la un calcul fără diviziune în trepte O(nm+ +'), deoarece vectorii uYk pentru O s - I prin inducție pe s și obținem t > c (c) Fie Xj - pentru t - valori ale lui j care nu sunt în coloane independente de Z Cu ajutorul oricărui lanț pentru Vx, calculăm V'x' pentru matricea V, aplicând rezultatele itemului (b) (d) Ai - x - y, A = Ai + Ai, Az = A + x, Ad = ( / ) x Az, Az = Ad + Ad, Az = Az -F y (= x + y/ ), At = Av - Ai, As = At + Ad (= x/ + y) Dar pentru {x/ + y, x + y/ } sunt necesare două înmulțiri deoarece coloanele ( (' ^ ) sunt independente de Z [Journal of Informaticii Processing ( ), - ] ] SECȚIUNEA Aflați primul coeficient diferit de zero Vt, ca în ( ), și împărțiți U(z) și V(r) la zm (deplasând coeficienții m locuri la stânga) Relația va fi o serie de puteri dacă și numai dacă Uo = ■ ■ ■ = Um-i - Avem VOP + NGP \u d Vo "t / n- (Vo ^ o) (Von K) - (^ JVi) (Vo'I- l "n ) - (P " If ) ( f Ts) Apoi se poate începe prin înlocuirea (Uj, V)) cu (VjUj, Vq xV]) pentru j > , apoi atribuirea IF și, în final, înlocuirea Wj cu Wj/Vq+ pentru j > O tehnică similară este posibilă în combinație cu alți algoritmi din această secțiune Da Dacă a = , atunci este ușor de demonstrat prin inducție că Wi = W = ••• = () Când a = , constatăm că Wn = Vp în funcție de identitate UV / k - (p - = VnVQ n k= Dacă W(z) = ev(z\ atunci W'(z) = V'(z)W(z), găsim IF = ev° și Wn = V -Vf-Wn-k PENTRU n > n k=l Dacă W(z) = În V(z), atunci V și W își schimbă rolurile Prin urmare, când Vo - , se stabilește regula: Dacă = și Wn = Vn + )VFIf * pentru n > [Folosind ex , coeficientul If pentru logaritm poate fi calculat în operații O(nlogn) R P Brent a remarcat că exp(V'(r)) poate fi de asemenea calculată asimptotic la aceeași rată prin aplicarea metodei lui Newton la f(x) = Inx - V(z) Prin urmare, exponentiația obișnuită ( + V'(z))° = exp(aln(l + V'(z))) poate fi efectuată și în operații O(n log r ) Vezi Analytic Computațional Complexity, editat de JF Traub (New York: Academic Press, ), - ] Obțineți seria de putere inițială Acesta poate fi folosit ca criteriu pentru algoritmul de inversare φ(x) = x + x( - xV(z)) (vezi algoritmul R) Apoi, când se cunosc If, , If i, ideea principală este să introduceți Vf, , VgtV-i, să calculați (IF -F • • • -F IfV-іzJV ) x (VY -F Vj v^iz ' ' ) = I + Do^H -FRn-\z N~ +O(z N) și folosind egalitatea Hn + - - + H' v-izn- = -(Wo + - + ID'-і z'V )(■% + -■+-Rv- z'v^ ) + (z'v) [Număr Matematică ( ), - ; acest algoritm este, de fapt, publicat pentru prima dată în M Sieveking, Computing ( ), - ] Rețineți că costul total al calculării N coeficienți este O(A ogA') operații aritmetice dacă înmulțirea "rapidă" a polinoamelor este folosit (vezi exercițiul - ) Wn - (tkk)/n când n = (w - )k + ; în caz contrar, (vezi exercițiul - ) G Intră Gi și Vi; atribuie n N, algoritmul este terminat; în caz contrar, introduceți Vp IlGn G Atribuiți Uk n > În acest din urmă caz, ecuația u(x) = q(x)v(x) + r(x) este echivalentă cu ecuația U(z) = Q(z)V (z) + zm~n+ R(z), unde U(x) = xmu(x~ ), V(x) = A^' ), Q( x) = xm~ld(x ) și R(x) = xn- r(x~ ) sunt polinoame "inverse" în u, v, q și r Pentru a găsi q(x) și r(x), calculăm primii m - n + coeficienți ai seriei de puteri U(z)/V(z) = W(z) + O(zm~n+ ), apoi se calculează seria de puteri U(z) - V(z)W(z), care are forma zm~n + IT(z), unde T(z) = To + Tiz + • ■ ■ Rețineți că } = pentru toate j > n, deci Q(z) - W(z) și R(z) - T(z) îndeplinesc cerințele Folosește exercițiul - cu u(z) " zN și i>(z) = Wo + ■•• + Așteptată aproximațiile sunt valorile ѵ (r)/v (r), obținute, desigur, cu ajutorul unui algoritm De la ex - rezultă că nu există posibilități suplimentare cu numărător și numitor coprim Dacă fiecare FI este un număr întreg, atunci algoritmul C, aplicat tuturor numerelor întregi, va avea proprietățile necesare Cometariu Pentru cei interesați de mai multe informații, a se vedea Claude Brezinski, History of Continued Fractions and Pade Aproximants (Berlin: Springer, ) Cazul în care N - n + și deg(wi) = deg(w ) = n prezintă un interes deosebit deoarece este echivalent cu așa-numitul sistem Toeplitz Metodele asimptotic rapide pentru sistemele Toeplitz sunt discutate în Bini and Pan, Polynomial and Matrix Computations (Boston: Birkhăuser, ), § Metoda propusă în acest exercițiu poate fi generalizată la o interpolare rațională arbitrară de forma W (z) = p(z)/q(z) (modulo (z - zi) (z - zn)) unde z este opțional ar trebui să fie diferit Astfel, valorile lui W(z) și mai multe dintre derivatele lor în mai multe puncte pot fi determinate cu precizie (vezi Richard P Brent, Fred G Gustavson și David YY Yun, J Algorithms ( ), - ) Dacă U(z) - z + UkZk + • • • și V(z) = zk + Vk+izk+ + • ■ ■, aflăm că diferența V(U(z)) - U'(z ) v(z) este Prin urmare, V(z) este definit în mod unic dacă este dat U(z), la fel ca și U(z), pentru V(z) și Uk- Soluția depinde de doi algoritmi auxiliari; primul permite rezolvarea ecuației V(z + zkU(z)) = ( + zk~ W(z))V(z) + zk~ S(z) + O(zk~i+n) pentru V( z ) = Vo + Viz + ■■■ + Vn izn , unde sunt date C (z), W(z), S(z) și n Dacă n = , setăm Vo = - S( )/Hz( ) sau alegem Vo arbitrar când S( ) = U'( ) = Trecem de la n la n Lăsa V(z + zkU(z)) = ( + гк~г W(z))V(z) + z*" S(z) - zk~ +nR(z) + O(zk~'+ n ), + zfc- lV(z) = (z/(z + zkU(z)))n(l + z* lV(z)) + O(zk~ +n), S(z) = (z/(z + zkU(z)))nR(z) + O(zn) и fie V(z) = Vn + Vn+iz + ■ ■ • + Vin-iz" satisface ecuatia V(z + zkU(z)) = ( + zk~ W(z))V(z) + z* S(z) + (zfc- +n) Folosind al doilea algoritm, rezolvăm W(z)U(z) + zU'(z) = V(z) + O(zn) pentru U(z) = Uo + Uiz + ■•• + Un-iz"- , unde sunt date V(z), W(z) și n Dacă n = , atunci setăm Uo = V( )/U/( ) sau alegem Uo în mod arbitrar pentru cazul când V'( ) = Hz( ) = Trecem de la n la n Fie W(z)U(z) + zU'(z) = V(z) - znR(z) + O(z n) și fie U(z) = Un + • • • + Uzn-iz"" - soluția ecuației (n + W(z)')U(z) + zU'(z) = R(z) + O(zn) Aplicând notația ( ), primul algoritm poate fi folosit pentru a rezolva ecuația V(JJ(z)) - U'(z)(z/U(z))kV(z) cu orice precizie necesară Fie V(z) = zkV(z) Pentru a găsi P(z), să presupunem că V(P(z)) = P'(z)V(z) + O(z k~ +n) Această ecuație este valabilă pentru n = când P(z) - z + azk și a este arbitrară Se poate trece de la z la n setând V(P(z)) = P'(z)V(z) + z k~ +n R(z)+O(z k~ + n) și înlocuind P (z) ) pe P(z)+zk+nP(z), unde al doilea algoritm este folosit pentru a găsi un polinom P(z) astfel încât (k + n - zV'(P(z))/V(z)) P (z) + zP'(z) = (zk/V(z))R(z) + O(zn) Din ecuaţia diferenţială U'(z)/U(z)k =■ l/zk rezultă că U(z)x~k = z k + c pentru o constantă c Astfel, constatăm că Î 'n'(z) = z/(l + cnz ~k) ^k~^ În mod similar, rezolvăm ( ) pentru V(z) arbitrar: dacă W'(z) = /V(z), atunci W(U^(z)) = W(z) + pc pentru unele c Este necesar să se arate că [tn] tn+ ((n + l)P*,+i(t)/V(t)n - nPjt(t)/V(t)n+ ) = Urmează din egalitatea n+ ) Prin urmare, primim [e]Rn( /W = wn Strângeți coeficienții la x y Din formula de convoluție rezultă că (l^,m)t'n(/+m) = (*)ѵ*|V(n-*)m, iar aceasta este echivalentă cu egalitatea [zn] V(z) ,+m= £fc([z*]V(z)')([zn t] V(z)m), care este un caz special al lui ( ) Cometariu Numele "poweroid" a fost introdus de JF Steffensen, care a fost primul dintre mulți autori care au studiat proprietățile uimitoare ale acestor polinoame [Acta Mathematica ( ), - ] O trecere în revistă a literaturii și o discuție ulterioară a subiectului pot fi găsite în următoarele câteva exerciții și, de asemenea, în D E Knuth, The Mathematica JournaJ ( ), - Unul dintre rezultatele obținute în acest articol este formula asimptotică Vn(z) = exV(-a> ( - Vry + O(y ) + O(x- )), dacă vi = , și sV'(s ) = y și y = n/x sunt mărginite când x -> oo și n -> oo Avem Vn(x) = xkn'[z"] V(z)k/kl = n![zn] Vn(x)/x = (n - )! [z"" ] V'(z) elV( ), când n > Egalitatea se poate obţine prin egalarea coeficienţilor la zn în ecuaţia V'(z) e(i+y)V(r) = V'(z) eiv( )e"v(r) Conform teoremei polinomiale -( ) avem sus! /fiV /UrV (vp\kp ki\k \ kn\ kІТ/ І !/ " ^ *i+* H -^kn=m fcj + ^ H-hnfcn =n Acești coeficienți apar și în formula lui Arbogast (Ex - ) Acești termeni ai ecuației pot fi ajustați la un set de partiții, așa cum este explicat în răspuns pentru acest exercițiu Formula recurentă Vnk = j )w>w(nj)(fc-l) eu J vă permite să calculați coloana k după coloanele și k - ; este ușor de interpretat în termeni de partiții { , ,i}, deoarece există modalități ("Zi) de a include un element n într-un submult de mărime j Primele câteva rânduri ale matricei sunt după cum urmează id t> Vi t> l>ll> " t> i> >s+Zi> l>ll> V? l> l>ll> + l> l> l>ll> + l>ll> l>ll> Vi [zn]W(z)k = { (z)fc)([ zn] V(z)J), deci wnk = (n' /k!) ((^ !) și A) X ((j!/n!)vnj) [E Jabotinsky, Comptes Rendus Acad sci Paris ( ), - ] (a) Dacă U(z) - aW(flz), obținem [zn] (aW(J (z))k = ak/ nwnk', în special, dacă t/(z) = V! '(z) = -W(-z), atunci = (-l')n~kwnk- Prin urmare, conform ex Ș^k unkVkm și ZZk VnkUkm corespund funcției z (b) [Soluție de Ira Gessel] Această identitate este de fapt echivalentă cu formula de inversare Lagrange: avem wnk = (- )n~kipk = (-l)n fc p [zn] ~ ]( )fc , iar conform ex coeficientul la zn în I- '(z)* este egal cu i- [tn ] ktn+k~ /V(t)n Pe de altă parte, definim This (-fc) [z"-*'] (V'( )/ ))^", care la rândul său este egal cu (- )n /z(n - ) (k + l)fc [zn ] zn+k~ /V(z)n (a) Dacă V(z) = t/{"}(z) și W(z) = Vi }(z), atunci W(z) = V(zW(z)e) = U(zW(z) V(zW(z) )°) = U(zW(z)°+ ) (Rețineți diferența dintre această lege și formulele similare С ]( r) = U(z), t/["][ ](z) = tTWl(z), care sunt aplicate în iterație ) (b) B(r)(z) este funcția generatoare pentru arbori binari, -( ), egală cu W(z)/z, în exemplul z - t - t care urmează algoritmul L În plus, B ^ ^(z) este funcția generatoare pentru arbori t-ari (exercițiul - ) (c) Indicația este echivalentă cu egalitatea zU^a\z)° = ^( ), care, la rândul său, este echivalentă cu formula z[/^"^(z)a/t (zt ^"^(z)")" = z Din teorema de inversare a lui Lagrange (Ex ) rezultă că [zn] W''- ^) = £[z~x]W(z)~n, unde x este un întreg pozitiv (Aici W(z)~n, seria Laurent, seria de puteri împărțită la puterea lui z; se poate folosi notația [zm]V(z) pentru seria Laurent ca și pentru seria de puteri ) Prin urmare, [zn ]t/{" }(zf = [z'l](Wl~ \z)/z)x/a' = [zn+x/a]W^ ](z)x/a este egal [z~x/Q] W{zyn-X>a = [z~x/°] z^~x^U(z)x+(tm), unde x/a este un întreg pozitiv Am obținut rezultatul pentru o mulțime infinită a Acest lucru este suficient, deoarece coeficienții (z)x sunt polinoame în a Cazuri particulare ale acestui rezultat au fost deja luate în considerare mai sus (în exercițiile - și - ) O consecință memorabilă a indicației este cazul când a = - : W(z) = zU(z) dacă și numai dacă U^ ^(z) = z/U^ ^(z) (d) Dacă Uo = și Vn(x) este un poweroid pentru V(z) = lnt/(z), atunci, așa cum sa demonstrat deja, În U^(z) Aceasta înseamnă că putem introduce poweroidul dat în prima identitate înlocuind y cu y - an în a doua formulă (a) Avem U = I + T, unde Tn este egal cu zero în rândurile ] (r + eG(r) + O(e ))fc = kzk~'L(z) (c) = AND t^"+e](z), și obținem = U[a] (U[c} (r)) = U[a\z + eL(z) + O(c )) De asemenea !>+c'( z) = H[f](UM(z)) = Ula](z) + e£(t/W(z)) + O(c ) (d) Egalitatea rezultă din faptul că U sunt interschimbate cu In U Ea definește Іп-і, când n > , deoarece coeficientul din /" і din partea stângă a egalității este egal cu pi , iar coeficientul din partea dreaptă a egalității este an(" i) = (r) - În mod similar, dacă u = • ■ ■ = Uk-i = ii* / , obținem Іk = ik și prin formula recursivă pentru n > k determinăm lk+i, h+ , ■■■■ Latura stângă a egalitatea are forma ln + + • ■ •, iar dreapta - Іп + (?)Zn+l-*M* + •••• În general, І = u , ІЗ = din - fui, / = U ~ U U + |u , h = Us - ^u u - u + і | ^u iz - u (e) Avem U = iar pentru un m fix, contribuția la un = u"i din al-lea termen este egal cu • ■ ln nilnin , unde suma peste n = n > ■ ■ ■ > m > po = Să aplicăm rezultatul obţinut la itemul (b) [Cm Trans amer Matematică soc ( ) - ] (a) De la ( ) și ex se obține U = VDV~ , unde V este matricea de putere a funcției Schröder și D este matricea diagonală diag(u, u , u , ) Atunci poți lua ln U = Vdiag(ln u, ip, p u, )V- (b) Egalitatea WVDV~ = VDV~''IV implică egalitatea (V U/V) O = £>(V U V) Elementele diagonale ale matricei D sunt diferite, deci V ШV trebuie să fie o matrice diagonală D' Astfel, W = VD'V~l și W are aceeași funcție Schroeder ca U În consecință, Wi / și W = V£ > AV , unde a = (Іп И'і)/( п Ui) Trebuie să fie k - I, deoarece [r * + ( ] C / (V (r)) \u d Uk + ii + -n-i + kUkV Pentru Pentru o demonstrație completă, este suficient să arătăm că Uk = Vk și U(V(z)) = V(U(z)) implică C/(z) = V(z) Să presupunem că I este minim cu Ui / V și să fie n = k + I - Atunci obținem vnk - vnk = (?)("/ ~ ѵ')- unj = vnj pentru j > k, unj = (" ) și unj = pentru I Această egalitate este necesară pentru a arăta că (z)n/n!) = ev = e"lnV( ), (aln V(z)) = aV(z)"' pentru toate numerele complexe a Prin urmare, relația de recurență necesară are forma (a) Wr = , ID = Ed\n,d>i((" + l)"(d)/t(o) - l)VdWn/d ; (b) Wi = , Wn = Xd\n,d> (t(d)/t(n))VdWn/d ; (c) Wi = , Wn = Vn + EAn,d> (W(") - VVdWn/d ■ [Cm H W Gould, AMM ( ), - Această formulă este valabilă atunci când t este orice funcție astfel încât t(m) + t(n) = i(mn) și t(n) = dacă și numai dacă n = , dar presupunând că t nu se descompune în factori primi Această metodă poate fi aplicată și serii de puteri cu un set arbitrar de variabile Atunci t este puterea generală a termenului serie ] ANEXA A TABELE ALE VALORILOR UNOR CONSTANTE tabelul VALORI UTILIZATE FRECVENT ÎN SUBPROGRAMELE STANDARD ȘI ÎN ANALIZA PROGRAMELOR DE CALCULATOR ( DE CIFRE ZECIMALE) х/ = -х/ = + х/ = + v'ÎO = -^ = -UZ = - = In = , + ІпЗ = -ln = + / п = + /lnlO = - г = - ° = тг/ = + /тг = + тг * = -UD = G ( / ) = + G ( / ) = -g ( / ) = + e = + /e = , + = , - Іп тг - -ф = + е = + е'/ * * = + sini = -cos = + -С'( ) = -С( ) = - p = , - n n = , - Valorile unor constante cu de caractere în tabel calculat pe un calculator desktop de John W Wrench, Jr pentru prima ediție a acestei cărți Când, în anii , un nou software a făcut posibilă calcularea lor pe computer, s-a dovedit că valorile obținute de D Rench erau corecte Valorile altor constante fundamentale cu de cifre sunt date în formulele -( ), -( ), -( ), -( ) și răspunsurile la ex - , - și - Tabelul VALORI ALE NUMERELOR ARMONICE, NUMERELOR BERNULLI ȘI NUMERELOR FIBONACCI PENTRU N MIC p i " Vp Fn p - / / / / / - / / / / / / - / / / / / / - / / / / / / - / / / / / / - / / / / / / - / / / / / / - / / / / Fie pentru orice x Hx = E(ț-^)T°(tm) n> TUi / - - În , #і/з = - |тг/л/ -| пЗ, # /з = I + |тг/х/ - | пЗ, # / = - |тг - п , # / = I + |tg - p , # / = - |tg / / - | p - |\/ p f, H / = § - |tg ■ ; ) &kj Simbol Kronecker: [J = fc] [zn] & Coeficientul lui zn în seria de putere g(z) E/w Suma tuturor f(k) astfel încât fc este un întreg și relaţia R(k) P/w Produsul tuturor /(fc) astfel încât valoarea lui k este R(b) este un număr întreg și R(k) min/(fc) Valoarea minimă a tuturor f(k) astfel încât R(b) valoarea lui k este un număr întreg și R(k) max/(fc) Valoarea maximă a tuturor /(fc) astfel încât R(b) valoarea lui k este un număr întreg și R(k) Secțiunea Sens de desemnare ȘRz Partea reală a z => JJ x; /ar "k xk Γ(x + t)/Γ(a;) = ffc> => JJ (x + j); /(x + k)~k) V o => JJ (xj): /(x-k)=±\ , , V /(x); q'(xY), unde q(x) = /(n )(ar) f[n\x) a n-a iterație: (n = => x-, /(/^"^(a:))) , /{n}(x) a n-a funcție indusă: /{n}(*) = /(£/• n; Fn i + F" ) Numărul Bn Bernoulli: n! [zn] g/(de exemplu - ) XY Produsul punctual al vectorilor X = (ac, ,xn) și Y = (m/i, ,yn): хіуі + ■■■ + xnup j\kj împarte k: k mod j = şi j > S\T Setați diferența: {a a aparține lui S și a nu aparține lui G} Ф Rotunjire sau operații speciale aia a i ) ; x-/kV) ( n \ Coeficient polinom (definit doar \P ,P , ■ ■ ■ ,Pt J când n = pi + n + - pt) Gn I LmJ Numărul Stirling de primul fel: k k% kp t => x; -x) Și valoarea absolută a lui z: Și cel mai mare număr întreg care nu depășește x\ Verificați la și Cel mai mic întreg > x: min*^ la (*) Funcția dinți de ferăstrău (*n) Sirul infinit AG , Xi, X , ■ ■ ■ (aici n face parte din denumire) Constanta lui Euler: limn-ts "(Нp - ln p) (^, /) Funcție gamma incompletă: e~ttx~ dt G(x) Funcția gamma: (x - )! = y(x, oo) l/rz! С(^) Funcție zeta: Іітв-к" (unde х > ) Secțiunea Sens de desemnare Kn(xi, ,xn) Continuanta £(u) Coeficientul conducător al polinomului u l(n) Cea mai mică lungime a lanțului aditiv pentru n L(n) Funcția Von Mangoldt v(n) Funcția Möbius iy(n) Numărul de unități în reprezentarea binară a unui număr O(f(n)) mare din f(n) ca n -> oo O(/(z)) mare din f(z) ca z -> "im Omega mare de f(n) ca n -> oo ѳ (/ Și Theta este mare de la / (n) când n -> oo G(X) Număr de numere prime: număr prim] D Raportul dintre circumferința unui cerc și diametrul acestuia: £ (- ) "/ ( n + ) n> f Raportul de aur: |( + \/ ) Set gol: {a: | = } ; a:/|a:|) deg(u) Gradul polinomului și cont(u) Conținutul polinomului și pp(u(x)) Partea primitivă a polinomului și l°g(>Z Logaritmul lui x la baza b: y astfel încât x = y (când ar> , >Ou ) În a: Logaritm natural: loge x Igar Log bază : log x exp x Funcția exponențială a lui x: ex j Ak j coprim la k: mcd(J, k) = mcd(j, k) Cel mai mare divizor comun al lui j și k: (j = fc = => ; max d) \ d\j, d\k / lcm(j, k) Cel mai mic multiplu comun al lui j și k: (jk = O=^O; min d) \ d>O,j\dtk\d / Secțiunea Sens de desemnare x mod y x modulo y: (m/ = => x; x - y [x/y\) u(x) mod v(x) Rest după împărțirea polinomului u la polinomul v x = a;' (modulo y) Comparabilitate (congruență) modulo y: x mod y = x' mod y xku x este aproximativ egal cu y , Pr(S(n)) Probabilitatea ca afirmația S(n) să fie adevărată pentru pozitiv aleatoriu numere întregi n Pr(S(X)) Probabilitatea ca afirmația S(X) să fie adevărată pentru variabile aleatoare X EX Aşteptarea matematică (valoarea medie) a unei variabile aleatoare X: x Pr (X = x) mean( = ) // Dacă data lock=-l, atunci nu există operand data=memoryEdata loc]; // Apel de date execute(instr type,data): // Executați comanda } } private static int get instr type(int adresa) { } private static int find data(int instr, int tip) { } private static void execute(int tip, int date) { } Procesoare Însuși faptul că se poate scrie un program care simulează funcționarea unei unități centrale de procesare arată că programul nu trebuie să fie executat de un procesor (dispozitiv) real Dimpotrivă, un alt program poate apela din memorie, poate determina tipul de comenzi și poate executa aceste comenzi Un astfel de program se numește interpret Am vorbit despre interpreți în capitolul Programele de interpret care imită funcționarea unui procesor sunt utilizate pe scară largă în dezvoltarea sistemelor informatice După ce dezvoltatorul a ales un limbaj de mașină (I) pentru un nou computer, el trebuie să decidă dacă să dezvolte un procesor care să execute programe în limbajul I, sau să scrie un program special pentru interpretarea programelor în aceeași limbă Dacă decide să scrie un interpret, va trebui să dezvolte hardware-ul pentru a rula acel interpret Proiectele hibride sunt de asemenea posibile, atunci când unele comenzi sunt executate de hardware, iar unele sunt interpretate Interpretul împarte comenzile în comenzi mai mici (elementare) Ca rezultat, o mașină proiectată să ruleze un interpret poate fi mult mai simplă și mai ieftină decât un procesor care rulează programe fără interpretare Astfel de economii sunt deosebit de importante cu un număr mare de comenzi complexe cu parametri diferiți În esență, economiile provin din însuși faptul de a înlocui hardware-ul cu un program (interpret) Primele computere acceptau un număr mic de comenzi, iar aceste comenzi erau simple Cu toate acestea, dezvoltarea unor computere mai puternice a dus, printre altele, la apariția unor comenzi mai complexe Dezvoltatorii și-au dat seama curând că, cu comenzi complexe, programele rulează mai repede, deși fiecare comandă individuală durează mai mult (Exemplele de astfel de instrucțiuni complexe includ efectuarea de operații în virgulă mobilă, furnizarea de acces direct la elementele matricei și așa mai departe ) Dacă s-a constatat că o pereche de instrucțiuni particulare sunt executate frecvent secvențial, a fost introdusă o nouă instrucțiune pentru a le înlocui pe acestea două Comenzile complexe erau, de asemenea, mai bune, deoarece unele operațiuni se suprapuneau uneori Astfel de operațiuni puteau fi efectuate în paralel, dar aceasta necesita echipament suplimentar Pentru computerele scumpe, de înaltă performanță, acest hardware suplimentar a meritat să fie cumpărat Astfel, computerele scumpe aveau mult mai multe comenzi decât cele ieftine Cu toate acestea, evoluțiile în software-ul și cerințele de compatibilitate a comenzilor au condus la faptul că comenzile complexe au fost utilizate în computerele cu costuri reduse, deși costul a fost în prim-plan, nu viteza Până la sfârșitul anilor , IBM, care era pe atunci lider pe piața calculatoarelor, a decis că producția unei familii de calculatoare, fiecare dintre ele executând aceleași comenzi, este mai profitabilă pentru companie însăși și pentru clienți Pentru a caracteriza acest nivel de interoperabilitate, IBM a inventat termenul de arhitectură Noua familie de calculatoare trebuia să aibă o singură arhitectură și multe modele diferite, diferite ca preț și viteză, dar "capabile" să ruleze aceleași programe Dar cum să construiești un ieftin Capitolul Organizarea sistemelor informatice un computer care poate executa toate comenzile complexe pe care le au mașinile scumpe de înaltă performanță? Soluția a fost interpretarea Această tehnologie, propusă pentru prima dată de Wilkes în , a permis dezvoltarea unor calculatoare simple, cu costuri reduse, care încă puteau executa un număr mare de instrucțiuni Drept urmare, IBM a creat arhitectura System/ , o familie de computere compatibile care diferă ca preț și performanță Hardware-ul care i-a permis să funcționeze fără interpretare a fost folosit doar la cele mai scumpe modele Calculatoarele simple cu interpreți de comandă aveau meritele lor Cele mai importante dintre ele au fost: + capacitatea de a corecta comenzi executate incorect sau chiar de a compensa erorile hardware; + capacitatea de a adăuga comenzi noi la costuri minime și, dacă este necesar, după cumpărarea unui computer; + capacitatea (datorită unei organizații structurate) de a dezvolta, testa și documenta comenzi complexe În anii , piața calculatoarelor a crescut rapid, calculatoarele noi puteau îndeplini din ce în ce mai multe funcții Cererea de calculatoare ieftine a stimulat crearea de calculatoare cu interpreți Capacitatea de a dezvolta hardware cu un interpret pentru un anumit set de instrucțiuni a condus la procesoare ieftine Tehnologia semiconductoarelor s-a dezvoltat rapid, costul scăzut a prevalat asupra performanței înalte, iar interpreții au început să fie utilizați din ce în ce mai mult în dezvoltarea computerelor Interpretarea a fost folosită în aproape toate computerele lansate în anii , de la minicalculatoare până la cele mai mari mașini Până la sfârșitul anilor , interpreții au început să fie utilizați în aproape toate modelele, cu excepția celor mai scumpe mașini cu performanțe foarte ridicate (de exemplu, Crau- și calculatoarele din seria Control Data Cyber ) Interpreții au asigurat implementarea instrucțiunilor complexe fără utilizarea hardware-ului costisitor, astfel încât dezvoltatorii puteau introduce instrucțiuni din ce în ce mai complexe și, de asemenea, (și chiar mai ales) extinde modul în care erau definiți operanzii Această tendință a atins apogeul cu computerul VAX dezvoltat de DEC; avea câteva sute de instrucțiuni și peste de moduri de a defini operanzii din fiecare instrucțiune Din păcate, arhitectura VAX a fost concepută cu un interpret în minte încă de la început, cu puțină atenție acordată performanței Acest lucru a dus la apariția unui număr mare de comenzi de importanță secundară, care erau greu de implementat direct Această omisiune a fost fatală atât pentru VAX, cât și pentru producătorul său (DEC) Compaq a cumpărat DEC în (deși Compaq a devenit parte a Hewlett-Packard trei ani mai târziu) Deși primele microprocesoare pe biți erau foarte simple și suportau un set mic de instrucțiuni, până la sfârșitul anilor chiar și ele au început să fie dezvoltate cu o orientare pentru interpret În această perioadă, principala problemă pentru dezvoltatori a fost complexitatea tot mai mare a microprocesoarelor Procesoare Principalul avantaj al interpretării a fost că a fost posibil să se dezvolte un procesor foarte simplu și să se implementeze toate cele mai complexe folosind un interpret Astfel, în loc să se dezvolte hardware complex, a fost necesar să se dezvolte un software complex Succesul sistemului Motorola cu un set mare de instrucțiuni interpretabile și eșecul simultan al computerului Zilog Z , care avea un set la fel de mare de instrucțiuni, dar fără interpret, au demonstrat beneficiile interpretării în dezvoltarea de noi mașini Acest succes a fost destul de neașteptat, având în vedere că computerul Z (predecesorul lui Zilog Z ) a fost mai popular decât Motorola (predecesorul lui Motorola ) Bineînțeles, și alți factori au jucat un rol important, cum ar fi faptul că Motorola a fost în afacerea cu cipuri de mulți ani, iar marca Zilog era deținută de Exxon, o mare companie petrolieră Un alt factor în favoarea interpretării este existența unor dispozitive de memorie de mare viteză, doar în citire, pentru stocarea interpreților (așa-numitele ROM-uri de comandă) Să presupunem că pentru a executa o instrucțiune interpretată normală, interpretul computerului Motorola trebuie să execute instrucțiuni (se numesc microinstrucțiuni), câte ns fiecare și să facă accesări RAM, de ns fiecare Timpul total de execuție pentru instrucțiune ar fi, prin urmare, de ns, doar de două ori mai mult decât ar dura în cel mai bun caz execuția directă a acestei instrucțiuni fără interpretare Și dacă nu ar exista o memorie specială de mare viteză doar pentru citire, execuția acestei instrucțiuni ar dura până la ns Astfel, semnificația ROM-urilor de comandă este evidentă Sisteme RISC și CISC La sfârșitul anilor , au existat multe experimente cu comenzi foarte complexe, care au fost posibile prin interpretare Dezvoltatorii au încercat să reducă decalajul dintre ceea ce pot face computerele și ceea ce necesită limbajele de nivel înalt Aproape nimeni nu s-a gândit atunci să dezvolte mașini mai simple, la fel de puțini oameni (din păcate) dezvoltă acum sisteme de operare, rețele, editori, etc La IBM, această tendință a fost contracarată de un grup de dezvoltatori condus de John Cock (John Sosuke); au încercat să întruchipeze ideile lui Seymour Cray prin crearea unui minicomputer experimental de înaltă performanță arhitecturi În , o echipă de dezvoltare de la Universitatea Berkeley condusă de David Patterson și Carlo Sequin a început dezvoltarea procesoarelor VLSI non-interpretative [ , ] Pentru a desemna acest concept, au inventat termenul RISC și noul procesor Capitolul Organizarea sistemelor informatice numit RISC I, care a fost urmat în curând de RISC II Puțin mai târziu, în , John Hennesy de la Stanford a proiectat și produs un alt cip, pe care l-a numit MIPS [ ] Aceste două cipuri s-au dezvoltat în produse SPARC și, respectiv, MIPS importante din punct de vedere comercial Noile procesoare erau semnificativ diferite de procesoarele comerciale ale vremii Deoarece erau incompatibile cu produsele existente, dezvoltatorii au fost liberi să includă noi seturi de instrucțiuni care ar putea îmbunătăți performanța generală a sistemului Inițial, accentul s-a pus pe comenzi simple care puteau fi executate rapid Cu toate acestea, dezvoltatorii și-au dat seama curând că cheia pentru performanța înaltă a computerului era să dezvolte comenzi care să poată fi executate rapid Adică nu este atât de important cât timp se execută cutare sau cutare comandă, mai important este câte comenzi pe secundă pot fi lansate La momentul în care au fost dezvoltate aceste procesoare simple, un număr relativ mic de instrucțiuni (de obicei în jur de ) a atras atenția tuturor Pentru comparație, numărul de instrucțiuni din calculatoarele VAX fabricate de DEC și computerele mari fabricate de IBM la acea vreme a variat între și Calculatorul RISC (Reduced Set Instruction Computer) era opus sistemului CISC (Complex Instruction Set Computer) set de instructiuni) Un exemplu de mașină CISC este computerul VAX, care domina mediul universitar la acea vreme Până în prezent, puțini oameni cred că principala diferență dintre RISC și CISC este numărul de echipe, dar numele sunt încă păstrate Din acel moment, a început un război ideologic grandios între susținătorii RISC și dezvoltatorii mainframe-urilor VAX, Intel și IBM Potrivit primei, cel mai bun mod de a proiecta calculatoare este de a include un număr mic de instrucțiuni simple, fiecare dintre ele executată într-un ciclu al căii de date (vezi Fig ), adică efectuează o operație aritmetică sau logică pe o pereche de registre (de exemplu, adăugare sau o operație logică AND) și plasează rezultatul înapoi într-un registru Ca argument, ei au susținut că, chiar dacă sistemul RISC trebuie să execute sau instrucțiuni în loc de cea pe care o execută CISC, RISC tot câștigă în viteză, deoarece instrucțiunile RISC se execută de ori mai repede (pentru că nu sunt interpretate) De asemenea, trebuie remarcat faptul că până în acest moment viteza memoriei principale s-a apropiat de viteza ROM-urilor de comandă speciale, astfel încât defectele de interpretare au fost evidente, ceea ce a crescut și mai mult popularitatea computerelor RISC Având în vedere avantajele de performanță ale RISC, ne-am aștepta ca computere precum Alpha de la DEC să domine piața față de computerele CISC (Pentiums, etc ) Cu toate acestea, nu s-a întâmplat nimic de acest fel Se pune întrebarea: de ce? În primul rând, calculatoarele RISC nu sunt compatibile cu alte modele și multe companii au investit miliarde de dolari în software pentru produsele Intel În al doilea rând, destul de ciudat, Intel a reușit să implementeze aceleași idei în arhitectura CISC Procesoarele Intel care incep cu procesorul contin Procesoare Un nucleu RISC care execută cele mai simple (și de obicei cele mai comune) instrucțiuni într-un singur ciclu de cale a datelor, în timp ce tehnologia convențională CISC interpretează instrucțiuni mai complexe Drept urmare, comenzile comune sunt executate rapid, în timp ce cele mai complexe și rare sunt lente Deși performanța este mai mică cu această abordare "hibridă" decât cu arhitectura RISC, noua arhitectură CISC are o serie de avantaje, deoarece permite utilizarea software-ului mai vechi fără modificări Principii de proiectare pentru calculatoare moderne Au trecut mai bine de douăzeci de ani de când au fost construite primele calculatoare RISC, dar unele principii ale funcționării acestora pot fi adoptate având în vedere stadiul actual al tehnologiei de dezvoltare hardware Dacă există o schimbare foarte drastică în tehnologie (de exemplu, un nou proces de fabricație face ca timpul de acces la memorie de ori mai rapid decât timpul de acces la CPU), toate condițiile se schimbă Prin urmare, designerii ar trebui să ia în considerare întotdeauna posibilele schimbări tehnologice care ar putea afecta echilibrul dintre componentele computerului Există o serie de principii de proiectare, denumite uneori principii RISC, pe care producătorii de procesoare de uz general încearcă să le urmeze ori de câte ori este posibil Din cauza unor constrângeri externe, cum ar fi cerința de compatibilitate cu alte mașini, trebuie să faceți compromisuri din când în când, dar aceste principii sunt scopul pentru care se străduiesc majoritatea dezvoltatorilor + Toate comenzile trebuie executate direct de hardware Adică, comenzile normale nu sunt interpretate de micro-comenzi Eliminarea stratului de interpretare îmbunătățește viteza de execuție a majorității comenzilor În calculatoarele CISC, instrucțiunile mai complexe pot fi împărțite în mai multe etape, care sunt apoi executate ca o secvență de microinstrucțiuni Această operațiune suplimentară încetinește mașina, dar poate fi folosită pentru comenzi care sunt rar utilizate + Computerul ar trebui să execute cât mai multe comenzi pe secundă Calculatoarele moderne folosesc multe moduri diferite de a îmbunătăți performanța, principala fiind să ruleze cât mai multe comenzi pe secundă Procesorul -MIPS este capabil să ruleze de milioane de instrucțiuni pe secundă, indiferent de cât timp durează executarea acestor instrucțiuni (MIPS este prescurtarea de la Milioane de instrucțiuni pe secundă, milioane de instrucțiuni pe secundă ) Acest principiu sugerează că paralelismul ar trebui să joace un rol major în îmbunătățirea performanței, deoarece este posibil să se execute un număr mare de instrucțiuni doar într-o perioadă scurtă de timp dacă este posibil să executați mai multe comenzi în același timp Capitolul Organizarea sistemelor informatice Deși instrucțiunile oricărui program sunt întotdeauna localizate în memorie într-o anumită ordine, computerul este capabil să schimbe ordinea în care sunt pornite (deoarece resursele de memorie necesare pot fi ocupate) și/sau finalizate Desigur, dacă instrucțiunea setează o valoare într-un registru și instrucțiunea folosește acel registru, trebuie avută o grijă deosebită ca instrucțiunea să nu citească valoarea din registru înainte de a fi acolo Pentru a evita astfel de erori, este necesar să stocați o cantitate mare de informații suplimentare în memorie, dar datorită capacității de a executa mai multe comenzi în același timp, performanța este încă mai mare + Comenzile ar trebui să fie ușor de decodat Limita numărului de comenzi care pot fi executate pe secundă depinde de rata de decodare a comenzilor individuale Decodificarea comenzilor vă permite să determinați ce resurse au nevoie și ce acțiuni trebuie efectuate Orice face acest proces mai ușor este util De exemplu, pot fi utilizate comenzi uniforme cu o lungime fixă și un număr mic de câmpuri Cu cât sunt mai puține formate de comandă diferite, cu atât mai bine + Memoria ar trebui să fie accesată numai prin comenzi de încărcare și stocare Una dintre cele mai ușoare modalități de a împărți o operație în pași separați este să luați operanzii majorității instrucțiunilor din registre și să returnați și acolo Operația de mutare a operanzilor din memorie în registre și invers poate fi efectuată în diferite instrucțiuni Deoarece accesul la memorie durează mult și întârzierea este imprevizibilă, aceste instrucțiuni pot fi preluate de alte instrucțiuni al căror singur scop este mutarea operanzilor între registre și memorie Adică, numai comenzile de încărcare și stocare (LOAD și STORE) ar trebui să acceseze memoria + Ar trebui să existe o mulțime de registre Deoarece accesul la memorie este destul de lent, computerul trebuie să aibă multe registre (cel puțin ) Dacă un cuvânt este apelat o dată din memorie, având în vedere un număr mare de registre, acesta poate fi păstrat într-un registru până când este nevoie Revenirea unui cuvânt dintr-un registru în memorie și reîncărcarea aceluiași cuvânt într-un registru sunt nedorite Cel mai bun mod de a evita mișcările inutile este să aveți suficiente registre Paralelism la nivel de instruire Designerii de computere se străduiesc să îmbunătățească performanța mașinilor lor O modalitate de a face procesoarele să funcționeze mai repede este creșterea vitezei de ceas, dar există unele limitări tehnologice asociate cu o anumită perioadă istorică Prin urmare, majoritatea dezvoltatorilor folosesc paralelismul (efectuarea a două sau mai multe operațiuni în același timp) pentru a îmbunătăți performanța la o anumită viteză a procesorului Există două forme principale de paralelism: paralelism la nivel de instrucțiune și paralelism la nivel de procesor În primul caz, paralelism Procesoare implementat prin rularea unui număr mare de comenzi în fiecare secundă În al doilea caz, mai multe procesoare lucrează simultan la o singură sarcină Fiecare abordare are propriile sale avantaje În această secțiune, ne vom uita la paralelismul la nivel de instrucțiune, iar în secțiunea următoare, ne vom uita la paralelismul la nivel de procesor Transportoare Se știe de mulți ani că principalul obstacol în calea vitezei mari de execuție a instrucțiunilor este nevoia de a le reaminti din memorie Pentru a rezolva această problemă, puteți apela instrucțiuni din memorie în avans și le puteți stoca într-un set special de registre Această idee a fost folosită încă din în dezvoltarea computerului IBM Stretch, iar setul de registre a fost numit buffer prefetch Astfel, când era necesară o anumită comandă, aceasta a fost apelată direct din buffer, iar accesul la memorie nu a avut loc De fapt, cu preîncărcarea, comanda este procesată în doi pași: mai întâi, comanda este invocată și apoi este executată Ideea unei conducte a avansat și mai mult această strategie Când utilizați o conductă, comanda este procesată nu în doi, ci în mai mulți pași, fiecare dintre acestea fiind implementat de o componentă hardware specifică și toate aceste componente pot funcționa în paralel Pe fig , și arată un transportor de cinci blocuri, care se numesc trepte Prima etapă (blocul C ) apelează comanda din memorie și o plasează într-un buffer unde este stocată până când este nevoie A doua etapă (blocul C ) decodifică această instrucțiune, determinând tipul acesteia și tipul operanzilor ei A treia etapă (blocul C ) localizează operanzii și îi apelează din registre sau din memorie С С СЗ С С Orez Transportor în cinci trepte (a); starea fiecărei etape în funcție de numărul de cicluri parcurse (b) cicluri afișate Capitolul Organizarea sistemelor informatice A patra etapă (blocul C ) execută instrucțiunea, de obicei prin trecerea operanzilor prin calea datelor (vezi Figura ) În cele din urmă, blocul C scrie rezultatul înapoi în registrul corect Pe fig , b vedem cum funcționează conducta în timp În timpul ciclului , blocul C procesează instrucțiunea prin rechemarea acesteia din memorie În timpul ciclului , blocul C decodifică instrucțiunea , în timp ce blocul C apelează din memorie instrucțiunea În timpul ciclului , blocul C apelează operanzii pentru instrucțiunea , blocul C decodifică instrucțiunea și blocul C apelează instrucțiunea În timpul ciclului , blocul C execută instrucțiunea , C apelează operanzii pentru instrucțiunea , C decodifică instrucțiunea și C apelează instrucțiunea În cele din urmă, în timpul ciclului , blocul C scrie rezultatul instrucțiunii înapoi în registru, în timp ce celelalte etape ale conductei procesați următoarele instrucțiuni Pentru a înțelege mai bine cum funcționează o conductă, luați în considerare un exemplu similar Imaginați-vă o fabrică de bomboane în care prăjiturile sunt coapte și ambalate pentru expediere separat Să presupunem că în departamentul de expediere există un transportor lung, de-a lungul căruia sunt lucrători (sau etape de procesare) La fiecare secunde (acesta este timpul ciclului), primul lucrător plasează o cutie de prăjituri goală pe banda transportoare Această cutie este trimisă celui de-al doilea muncitor, care pune tortul în ea Cutia de tort este apoi livrată unui al treilea lucrător care o închide și sigilează Apoi se duce la al patrulea muncitor, care îi pune o ștampilă În cele din urmă, un al cincilea muncitor scoate cutia de pe banda transportoare și o pune într-un container mare pentru a fi expediată la supermarket Conducta computerului funcționează aproape în același mod: fiecare comandă (în cazul unei fabrici de bomboane, a unui tort) trece prin mai multe etape de procesare înainte de execuția finală Revenind la conducta noastră din Fig Să presupunem că timpul de ciclu pentru această mașină este de ns Apoi este nevoie de ns pentru ca o instrucțiune să treacă prin întreaga conductă La prima vedere, poate părea că un astfel de computer va executa de milioane de instrucțiuni pe secundă, dar în realitate viteza lui este mult mai mare În timpul fiecărui ciclu ( ns), o nouă instrucțiune este finalizată, astfel încât mașina execută nu , ci de milioane de instrucțiuni pe secundă! Conductele permit un compromis între latență (timpul necesar pentru a executa o singură instrucțiune) și debitul procesorului (numărul de instrucțiuni pe care un procesor le execută pe secundă) Dacă timpul dus-întors este T ns și conducta are n etape, latența va fi nT ns Deoarece o comandă este executată într-un apel și / T sunt tastate într-o secundă din astfel de apeluri, numărul de comenzi pe secundă este, de asemenea, IO / T Să presupunem că dacă T = ns, atunci de milioane de comenzi sunt executate în fiecare secundă Împărțiți rata de instrucțiuni la milion pentru a obține valoarea MIPS; astfel, ( /G)/ = /T MIPS În principiu, viteza de execuție a instrucțiunilor poate fi măsurată și în miliarde de operații pe secundă (BIPS Instructions Per Second, BIPS), dar nimeni nu face acest lucru și noi nu o vom face Procesoare Arhitecturi suprascalare Un transportor este bun, dar două sunt și mai bune Una dintre schemele posibile ale unui procesor cu două conducte este prezentată în Fig Se bazează pe transportorul prezentat în Fig Aici, unitatea generală de preluare a instrucțiunilor apelează simultan două instrucțiuni din memorie și plasează fiecare dintre ele într-una dintre conducte Fiecare conductă conține o ALU pentru operațiuni paralele Pentru a fi executate în paralel, două instrucțiuni nu trebuie să intre în conflict asupra resurselor (cum ar fi registrele) și nici una nu trebuie să depindă de rezultatul executării celeilalte Ca și în cazul unei singure conducte, fie compilatorul trebuie să garanteze absența unor situații anormale (când, de exemplu, hardware-ul nu verifică comenzile pentru incompatibilitate și produce un rezultat incorect la procesarea unor astfel de comenzi), fie din cauza hardware-ului suplimentar, conflictele trebuie detectate și eliminate direct în timpul executării comenzilor С С СЗ С С Orez Conductă dublă în cinci trepte cu o unitate comună de preluare a instrucțiunilor La început, conductele (atât duale, cât și convenționale) au fost utilizate numai în calculatoarele RISC Procesorul și predecesorii săi nu le-au avut Conductele în procesoarele Intel au apărut abia începând cu modelul Procesorul avea o conductă în cinci etape, iar Pentium avea două astfel de conducte O schemă similară este prezentată în Fig , dar împărțirea funcțiilor între a doua și a treia etapă (au fost numite decodor și decodor ) a fost ușor diferită Conducta principală (u-pipeline) ar putea executa comenzi arbitrare A doua conductă (v-pipeline) ar putea executa doar instrucțiuni întregi simple, precum și o instrucțiune simplă în virgulă mobilă (FXCH) Există reguli complexe pentru a determina dacă o pereche de instrucțiuni este compatibilă în ceea ce privește capacitatea de a se executa în paralel Dacă comenzile dintr-o pereche erau complexe sau incompatibile, doar una dintre ele a fost executată (în u-pipeline) A doua echipă rămasă a fost apoi asociată cu următoarea echipă Comenzile au fost întotdeauna executate în ordine Astfel, procesorul Pentium conținea compilatoare speciale care combinau instrucțiuni compatibile în perechi și puteau produce programe care rulau mai repede decât în versiunile anterioare Măsurătorile au arătat că programele în care Trebuie menționat că funcționarea paralelă a unităților de procesor individuale a avut loc în microprocesorul anterior ( ) Acest mecanism a devenit prototipul conductei în etape a microprocesorului - Notă științific ed Capitolul Organizarea sistemelor informatice se folosesc operații cu numere întregi, la aceeași viteză de ceas, Pentium-ul este aproape de două ori mai rapid decât [ ] Fără îndoială, avantajul de viteză a fost obținut datorită celei de-a doua conducte Tranziția la patru conducte este posibilă, dar necesită hardware greoi (rețineți că informaticienii, spre deosebire de folclorişti, nu cred în numărul norocos trei) În schimb, se folosește o abordare diferită Ideea principală este o conductă cu multe blocuri funcționale, așa cum se arată în Fig Pentium II, de exemplu, are o structură similară (o vom analiza în detaliu în Capitolul ) În , termenul de arhitectură superscalar a fost introdus pentru a desemna această abordare [ ] Cu toate acestea, o idee similară a fost întruchipată cu treizeci de ani mai devreme în computerul CDC Acest computer a numit instrucțiunea din memorie la fiecare ns și a plasat-o într-unul din cele blocuri funcționale pentru execuție paralelă În timp ce comenzile erau executate, CPU a apelat următoarea comandă C Orez Procesor superscalar cu cinci blocuri funcționale De-a lungul timpului, sensul termenului "superscalar" s-a schimbat oarecum Superscalar se referă acum la procesoare care pot rula mai multe instrucțiuni (de multe ori patru până la șase) într-un singur ciclu de ceas Desigur, pentru a transmite toate aceste comenzi, un procesor superscalar trebuie să aibă mai multe blocuri funcționale Deoarece în procesoarele de acest tip, de regulă, este prevăzută o conductă, structura sa corespunde de obicei cu Fig În lumina unei astfel de dinamici terminologice, astăzi se poate susține că computerul nu era superscalar din punct de vedere tehnic - la urma urmei, nu a fost rulată mai mult de o instrucțiune într-un singur ciclu de ceas Cu toate acestea, un rezultat similar a fost obținut în acest caz - comenzile au fost lansate mai repede decât au fost executate De fapt, diferența de performanță între Procesoare Un procesor cu un ciclu de ns care trimite o instrucțiune la patru blocuri funcționale în acea perioadă și un procesor cu un ciclu de ns care rulează patru instrucțiuni în acel timp este subtil Ambele procesoare aderă la principiul că viteza de pornire depășește viteza de control; în acest caz, sarcina de lucru este distribuită între mai multe blocuri funcționale Rețineți că la ieșirea etapei , comenzile apar mult mai repede decât este capabilă etapa să le proceseze Dacă la ieșirea etapei instrucțiunile au apărut la fiecare ns și toate blocurile funcționale și-au făcut treaba în ns, atunci doar un singur bloc ar funcționa întotdeauna la etapa , ceea ce ar face însăși ideea unei conducte fără sens De fapt, majoritatea blocurilor funcționale din etapa (mai precis, atât blocurile de acces la memorie, cât și blocul în virgulă mobilă) durează mult mai mult de un ciclu pentru a procesa o instrucțiune După cum se poate observa din fig , pot exista mai multe ALU-uri în etapa Paralelismul procesorului Cererea de calculatoare care rulează la viteze din ce în ce mai mari continuă neabătută Astronomii vor să afle ce s-a întâmplat în prima microsecundă după Big Bang, economiștii vor să modeleze întreaga economie mondială, adolescenții vor să joace jocuri interactive D cu prietenii lor virtuali pe Internet Procesoarele devin din ce în ce mai rapide, dar au în permanență probleme de transfer de date, deoarece viteza de propagare a undelor electromagnetice în firele de cupru și a luminii în cablurile de fibră optică rămâne în continuare la cm/ns, indiferent cât de inteligenți sunt inginerii Intel În plus, cu cât procesorul rulează mai repede, cu atât se încălzește mai mult , astfel încât apare sarcina de a-l proteja de supraîncălzire Paralelismul la nivel de instrucțiuni ajută într-o anumită măsură, dar conductele și arhitectura superscalară îmbunătățesc de obicei performanța doar cu un factor de - Pentru a crește productivitatea de , sau de mai multe ori, trebuie să creați computere cu mai multe procesoare Să facem cunoștință cu dispozitivul unor astfel de computere Calculatoare Matrix Multe probleme din științele fizice și tehnice implică utilizarea de tablouri sau alte structuri ordonate Adesea, aceleași calcule pot fi efectuate pe diferite seturi de date în același timp Ordinea și structura programelor concepute pentru a efectua acest tip de calcule sunt foarte convenabile în ceea ce privește accelerarea calculelor datorită procesării paralele a comenzilor Există două scheme pentru implementarea accelerată a programelor științifice mari Deși ambele scheme sunt în multe privințe Acest lucru nu este complet corect Există multe exemple care contrazic această afirmație Disiparea căldurii, desigur, depinde de frecvența de comutare a elementelor, dar depinde și de dimensiunea acestor elemente și de tensiunea la care funcționează - Notă științific ed Capitolul Organizarea sistemelor informatice sunt similare, unul dintre ele implică extinderea unui singur procesor, celălalt - adăugarea unui computer paralel Un procesor matrice (procesor argau) este format dintr-un număr mare de procesoare similare care execută aceeași secvență de instrucțiuni pentru diferite seturi de date Primul astfel de procesor din lume a fost ILLIAC IV (Universitatea din Illinois) Este prezentat schematic în Fig [ ] Ideea inițială a fost de a construi o mașină formată din patru cadrane, fiecare dintre ele conținând o matrice x de blocuri procesor/memorie A existat un bloc de control pentru fiecare cadran A trimis comenzi care au fost executate de toate procesoarele simultan, în timp ce fiecare procesor își folosea propriile date din propria memorie (datele au fost încărcate în timpul inițializării) Această soluție, care diferă semnificativ de mașina standard von Neumann, este uneori denumită arhitectura SIMD (Single Instruction-stream Multiple Data-stream) Datorită costului foarte ridicat, a fost construit doar un astfel de cadran, dar ar putea efectua de milioane de operații în virgulă mobilă pe secundă Dacă mașina ar fi construită folosind patru cadrane, ar putea efectua miliard de operații în virgulă mobilă pe secundă, iar puterea de calcul a unei astfel de mașini ar fi de două ori mai mare decât a computerelor din întreaga lume Bloc de control Difuzați comenzi Orez Procesor matrice ILLIAC IV O matrice x de blocuri de procesor/memorie Din punctul de vedere al unui programator, un procesor vectorial este foarte asemănător cu un procesor matrice La fel ca matricea, este extrem de eficient atunci când se efectuează o secvență de operații pe perechi de elemente de date Cu toate acestea, spre deosebire de un procesor cu matrice, toate operațiunile de adunare sunt efectuate într-un singur bloc de însumare, care are o structură pipelined Cray Research, fondată de Seymour Cray, a lansat multe modele de procesoare vectoriale, începând cu modelul Cry- ( ) Cray Research face parte acum din SGI Procesoare Ambele tipuri de procesoare funcționează cu matrice de date Ambele execută aceleași instrucțiuni, care, de exemplu, adună în perechi elementele a doi vectori Totuși, dacă procesorul matriceal are atât de mulți sumatori câte elemente sunt în matrice, procesorul vectorial conține un registru vectorial format dintr-un set de registre condiționale Aceste registre sunt încărcate din memorie cu o singură instrucțiune care de fapt o face secvenţial Instrucțiunea de adăugare adaugă elementele a doi astfel de vectori în perechi, încărcându-le din două registre vectoriale într-un sumator cu o structură pipeline Ca urmare, din sumator iese un alt vector, care fie este plasat în registrul vectorial, fie imediat folosit ca operand la efectuarea unei alte operații cu vectori Procesoarele Matrix sunt în prezent scoase din producție, dar principiul pe care se bazează este încă relevant O idee similară este folosită în seturile de instrucțiuni MMX și SSE ale procesoarelor Pentium și rezolvă cu succes problema execuției accelerate a programelor multimedia În acest sens, computerul ILLIAC IV poate fi considerat unul dintre progenitorii procesorului Pentium Multiprocesoare Elementele procesorului matriceal sunt interconectate, deoarece activitatea lor este controlată de o singură unitate de control Un sistem de mai multe procesoare paralele care partajează o memorie comună se numește multiprocesor Deoarece fiecare procesor poate scrie informații în orice parte a memoriei și poate citi informații din orice parte a memoriei, pentru a evita orice inconsecvență, funcționarea lor trebuie să fie coordonată de software Într-o situație în care două sau mai multe procesoare au capacitatea de a interacționa strâns, iar acesta este cazul multiprocesoarelor, aceste procesoare sunt numite strâns cuplate (strâns cuplate) Există diferite moduri de a implementa această idee Cel mai simplu dintre ele este conectarea mai multor procesoare și memorie partajată cu o singură magistrală Schema unui astfel de multiprocesor este prezentată în fig , a Multe companii produc sisteme similare Este ușor de înțeles că dacă aveți un număr mare de procesoare rapide care încearcă în mod constant să acceseze memoria prin aceeași magistrală, vor apărea conflicte Au fost dezvoltate diverse scheme pentru a rezolva această problemă și pentru a îmbunătăți performanța computerului Una dintre ele este prezentată în Fig b Într-un astfel de computer, fiecare procesor are propria sa memorie locală care este inaccesibilă altor procesoare Această memorie este utilizată pentru acele programe și date care nu trebuie să fie partajate între mai multe procesoare La accesarea memoriei locale, magistrala principală nu este utilizată și astfel cantitatea de informații transferate prin aceasta devine mai mică Sunt posibile și alte soluții la problemă (de exemplu, memoria cache) Multiprocesoarele au un avantaj față de alte tipuri de computere paralele, deoarece este foarte ușor să lucrezi cu o singură memorie partajată De exemplu, să ne imaginăm că programul caută celule canceroase pe terminat Capitolul Organizarea sistemelor informatice imagine microscopică a țesutului Fotografia digitală poate fi stocată într-o memorie partajată, fiecare procesor examinând o zonă specifică a fotografiei Deoarece fiecare procesor are acces la o memorie partajată, examinarea unei celule situate în mai multe zone simultan nu este dificilă Anvelopa Anvelopa a b Orez Multiprocesor cu o singură magistrală și memorie partajată (a); multiprocesor cu propria memorie locală pentru fiecare procesor (b) Multicalculatoare Multiprocesoarele cu un număr mic de procesoare (< ) sunt destul de ușor de dezvoltat, dar crearea de multiprocesoare mari prezintă anumite dificultăți Dificultatea constă în legarea tuturor procesoarelor la o memorie partajată Atât de mulți dezvoltatori au abandonat pur și simplu ideea memoriei partajate și au început să creeze sisteme fără memorie partajată, constând dintr-un număr mare de computere interconectate, fiecare dintre ele având propria sa memorie Astfel de sisteme se numesc multicalculatoare În acestea, procesoarele sunt slab cuplate, spre deosebire de procesoarele strâns cuplate din sistemele multiprocesor Procesoarele unui multicomputer își trimit mesaje unul altuia (similar cu e-mail-ul, dar mult mai rapid) Fiecare computer nu trebuie să fie conectat la oricare altul, așa că rețelele bidimensionale și tridimensionale, precum și copacii și inelele, sunt utilizate în mod obișnuit ca topologii Deși mesajele trec prin unul sau mai multe computere intermediare în drum spre destinație, timpul de transmisie este de doar câteva microsecunde Multicomputere care conțin până la de procesoare sunt deja în funcțiune Deoarece multiprocesoarele sunt mai ușor de programat și multicalculatoarele de proiectat, a apărut ideea de a crea sisteme hibride care să combine avantajele ambelor topologii Astfel de computere prezintă iluzia memoriei partajate, în timp ce în realitate nu există Ne vom uita la multiprocesoare și multicalculatoare mai detaliat în Capitolul memoria principala memoria principala Memoria este partea unui computer care stochează programe și date De asemenea, puteți utiliza termenul de dispozitiv de stocare Fără memorie, unde procesoarele citesc și scriu informații, nu ar exista computere digitale cu programe încorporate Pic Unitatea de bază de stocare a datelor în memorie este o cifră binară numită bit Un bit poate fi fie , fie Aceasta este cea mai mică unitate de memorie (Un dispozitiv care stochează doar zerouri ar putea sta cu greu la baza memoriei Sunt necesare cel puțin două valori ) Mulți oameni cred că computerele folosesc aritmetica binară pentru că este "eficientă" Ele înseamnă (deși rareori își dau seama) că informațiile digitale pot fi stocate datorită diferenței dintre diferitele valori ale unor caracteristici fizice, cum ar fi tensiunea sau curentul Cu cât trebuie distinse mai multe valori, cu atât diferențele dintre valorile adiacente sunt mai mici și memoria este mai puțin fiabilă În sistemul binar, trebuie să se distingă doar două valori, prin urmare, aceasta este cea mai fiabilă metodă de codificare a informațiilor digitale Dacă nu sunteți familiarizat cu sistemul binar, aruncați o privire la Anexa A Se crede că unele computere, cum ar fi mainframes-urile IBM, folosesc atât aritmetică zecimală, cât și binară De fapt, aici este folosit așa-numitul cod zecimal binar biți sunt folosiți pentru a stoca o zecimală Acești biți oferă combinații pentru a găzdui valori diferite (de la la ) În acest caz, cele combinații rămase nu sunt folosite Iată cum arată numărul în numere binare zecimale și binare pure (ambele folosesc biți): BCD - ; Reprezentarea -binară este În notația zecimală codificată binar, biți sunt suficienți pentru a stoca un număr de la la , adică sunt disponibile doar de combinații diferite, iar în notație binară, aceiași biți vă permit să obțineți de combinații Din acest motiv se spune că sistemul binar este mai eficient Cu toate acestea, imaginați-vă ce s-ar putea întâmpla dacă un inginer genial ar veni cu un dispozitiv electronic foarte fiabil care vă permite să stocați descărcări de la la prin împărțirea intervalului de tensiune de la la volți în intervale Patru astfel de dispozitive ar putea stoca un număr zecimal de la la , adică de combinații Și dacă aceleași dispozitive ar fi folosite pentru a stoca numere binare, acestea ar putea conține doar combinații Desigur, în acest caz, sistemul zecimal ar fi mai eficient Capitolul Organizarea sistemelor informatice Adrese de memorie Memoria este formată din celule, fiecare dintre ele poate stoca o anumită porțiune de informații Fiecare celulă are un număr numit adresă După adresă, programele se pot referi la o anumită celulă Dacă memoria conține n celule, acestea vor avea adrese de la la n - Toate celulele de memorie conțin același număr de biți Dacă o celulă este formată din k biți, poate conține oricare dintre cele k combinații Pe fig prezintă opțiuni diferite pentru organizarea memoriei pe de biți Rețineți că celulele adiacente, prin definiție, au adrese consecutive A Orez Trei opțiuni pentru organizarea memoriei pe de biți Pe computerele care utilizează sistemul de numere binar (inclusiv reprezentări octale și hexazecimale ale numerelor binare), adresele de memorie sunt, de asemenea, exprimate în numere binare Dacă adresa constă din m biți, numărul maxim de celule adresate va fi de nm De exemplu, adresa de accesare a memoriei prezentată în Fig , a, trebuie să fie format din cel puțin biți pentru a exprima toate numerele de la la I Cu dispozitivul de memorie prezentat în fig , b și , c, o adresă de biți este suficientă Numărul de biți din adresă determină numărul maxim de celule de memorie adresabile și nu depinde de numărul de biți din celulă Adresele de biți sunt necesare atât pentru memorie de celule de biți fiecare, cât și pentru memorie de celule de de biți fiecare În tabel Figura arată numărul de biți dintr-o celulă de memorie a unor calculatoare comerciale memoria principala Tabelul Numărul de biți dintr-o celulă de memorie a unor modele de computere comerciale Calculator Numărul de biți pe celulă Burroughs B IBM RS DEC PDP- IBM DEC PDP- XDS Electrologica X XDS Sigma Honeywell CDC CDC Cyber O celulă este cea mai mică unitate de memorie care poate fi accesată În ultimii ani, aproape toți producătorii au produs computere cu celule de rând de biți, care sunt numite octeți Octeții sunt grupați în cuvinte Pe un computer cu cuvinte de de biți, există octeți pe cuvânt, iar pe un computer cu cuvinte de de biți sunt octeți O astfel de unitate ca un cuvânt este necesară, deoarece majoritatea comenzilor efectuează operații pe cuvinte întregi (de exemplu, adăugați două cuvinte) Astfel, o mașină de de biți are registre de de biți și instrucțiuni pentru manipularea cuvintelor de de biți, în timp ce o mașină de de biți are registre de de biți și instrucțiuni pentru mutarea, adăugarea, scăderea și alte operațiuni pe cuvinte pe de biți Ordinea octetilor Octeții dintr-un cuvânt pot fi numerotați de la stânga la dreapta sau de la dreapta la stânga La prima vedere, poate părea că nu există nicio diferență între aceste două opțiuni, dar vom vedea în curând că alegerea contează foarte mult Pe fig a arată zona de memorie a unui computer pe de biți, în care octeții sunt numerotați de la stânga la dreapta (cum ar fi computerele SPARC sau mainfra-urile IBM) Pe fig , b arată o zonă de memorie similară a unui computer pe de biți cu numerotarea octeților de la dreapta la stânga (ca și în cazul computerelor Intel) În primul dintre aceste sisteme, numerotarea începe de la cel mai înalt ordin și, prin urmare, aparține categoriei calculatoarelor cu big endian - spre deosebire de sistemele cu little endian (Fig , a) Apropo, acești termeni ("big endian" și "little endian") sunt împrumuți din Călătoriile lui Swift Gulliver - el, după cum ne amintim, a ironicizat disputa dintre politicieni despre ce capăt să spargă ouăle Pentru prima dată au fost introduse în circulația științifică într-un articol virtuos al lui Cohen [ ] Capitolul Organizarea sistemelor informatice octeți -cuvânt pe de biți-►- Orez Little Endian memorie (a); memorie big endian (b) octeți cuvânt pe de biți- b Este important de înțeles că în ambele sisteme, un întreg de de biți (de exemplu, ) este reprezentat de biți în cei trei biți din dreapta unui cuvânt, iar restul de de biți sunt reprezentați de zerouri Dacă octeții sunt numerotați de la stânga la dreapta, biții sunt în octetul (sau , sau Pit d ) Dacă octeții sunt numerotați de la dreapta la stânga, biții sunt în octetul (sau sau etc ) În ambele sisteme, cuvântul care conține acest număr întreg are adresa Dacă computerele conțin numai numere întregi, nu apare nicio dificultate Cu toate acestea, multe aplicații necesită utilizarea nu numai a numerelor întregi, ci și a șirurilor de caractere și a altor tipuri de date Luați în considerare, de exemplu, o înregistrare simplă de date de personal constând dintr-un șir (numele angajatului) și două numere întregi (vârsta și numărul departamentului) Linia este terminată cu unul sau mai mulți octeți nuli, proiectați să umple întregul cuvânt Pe fig , iar pentru intrarea "Jim Smith, ani, departament " ( x + = ), este prezentată o schemă cu numerotarea octeților de la dreapta la stânga, iar în fig , b - cu numerotarea octetilor de la stânga la dreapta Difuzare Reverse Direct cu conversie Orez Înregistrarea datelor angajaților pentru o mașină little-endian (a); aceeași intrare pentru o mașină endian (b); rezultatul transferului unei înregistrări de la o mașină little endian la o mașină big endian (c); rezultat al permutării octeților în cazul precedent (d) memoria principala Ambele reprezentări sunt bune și consecvente intern Problemele încep atunci când unul dintre computere încearcă să trimită înregistrarea către un alt computer prin rețea Să presupunem că o mașină numerotată de octeți de la stânga la dreapta trimite o înregistrare către un computer cu un octet de la dreapta la stânga, câte un octet, începând cu octetul și terminând cu octetul Pentru simplitate, vom presupune că biții nu sunt inversate în timpul transmisiei Astfel, octetul este transferat de la prima mașină la a doua în octetul și așa mai departe, așa cum se arată în Figura , c Computerul care a primit înregistrarea tipărește corect numele, dar vârsta este de x , iar numărul departamentului este, de asemenea, distorsionat Această situație apare deoarece atunci când înregistrarea este transferată, ordinea literelor din cuvânt este schimbată după cum este necesar, dar este schimbată și ordinea octeților în numere întregi, ceea ce duce la un rezultat incorect Soluția evidentă a problemei este utilizarea unui program care ar inversa octeții din cuvânt după ce a făcut copierea Rezultatul unei astfel de operații este prezentat în Fig , d Vedem că numerele au devenit corecte, dar linia s-a transformat în "MIJTIMS", în timp ce litera "H" se află în general separat Șirul este inversat deoarece computerul citește mai întâi octetul (spațiu), apoi octetul (M) și așa mai departe Nu există o soluție simplă Există o singură cale, dar este ineficientă (Trebuie să puneți un antet înaintea fiecărei unități de date, indicând ce tip de date urmează - un șir, un număr întreg etc Acest lucru va permite computerului receptor să efectueze doar conversiile necesare ) În mod clar, lipsa unui octet standardul de comandă este un inconvenient major în schimbul de informații între diferite mașini Cod de corectare a erorilor Memoria computerului din cauza supratensiunii și din alte motive poate fi greșită din când în când Pentru a trata erorile, se folosesc coduri speciale care pot detecta și corecta erorile În acest caz, se adaugă biți suplimentari fiecărui cuvânt din memorie într-un mod special Când un cuvânt este citit din memorie, acești biți suplimentari sunt verificați pentru a detecta erori Pentru a înțelege cum să tratați erorile, trebuie să studiați cu atenție care sunt aceste erori Să presupunem că un cuvânt este format din m biți de date, la care adăugăm suplimentar r biți (biți de verificare) Fie lungimea totală a cuvântului de n biți (adică n = m + r) O unitate de n biți, care conține m biți de date și r biți de verificare, este adesea numită un cuvânt cod Pentru oricare două cuvinte de cod, de exemplu și , este posibil să se determine câți biți corespunzători diferă în ele În acest exemplu, există trei astfel de biți Pentru a determina numărul de biți diferiți, trebuie să efectuați o operație logică EXCLUSIVĂ SAU pe două cuvinte cod și să numărați numărul de biți cu o valoare de în rezultat Numărul de poziții de biți prin care două cuvinte diferă se numește interval Hamming [ ] Dacă intervalul Hamming pentru două cuvinte este d, atunci Capitolul Organizarea sistemelor informatice că este nevoie de d biți erori pentru a transforma un cuvânt în altul De exemplu, intervalul Hamming pentru cuvintele de cod și este , deoarece erorile de biți sunt suficiente pentru a transforma primul cuvânt în al doilea Memoria este formată din cuvinte de m biți, deci există combinații de m de biți Cuvintele de cod constau din n biți, dar datorită modului în care sunt numărați biții de verificare, sunt permise doar (tm) din " cuvinte de cod Dacă în memorie este găsit un cuvânt de cod invalid, computerul știe că a apărut o eroare Cu un algoritm de numărare a cifrelor de verificare, este posibilă compilarea unei liste complete de cuvinte cod valide, iar din această listă găsiți două cuvinte pentru care intervalul Hamming va fi minim Acesta este intervalul Hamming pentru codul complet Capacitatea de a verifica și corecta erorile pentru un anumit cod depinde de intervalul Hamming al acestuia Pentru a detecta erori de d biți, este necesar un cod cu un interval de d + , deoarece erorile d nu pot transforma un cuvânt de cod valid într-un alt cuvânt de cod valid În consecință, pentru a corecta erorile d biți, este necesar un cod cu un interval de d + , deoarece în acest caz cuvintele de cod valide diferă atât de mult între ele încât, chiar dacă apar modificări d, cuvântul de cod original va fi mai aproape de eroare decât orice alt cuvânt cod, astfel încât să poată fi identificat cu ușurință Ca exemplu simplu de cod de detectare a erorilor, luați în considerare un cod care adaugă un bit de paritate la date Bitul de paritate este ales astfel încât numărul de biți cu valoarea în cuvântul de cod să fie par (sau impar) Intervalul Hamming pentru acest cod este , deoarece orice eroare pe un singur bit are ca rezultat un cuvânt de cod de paritate incorect Cu alte cuvinte, două erori pe un singur bit sunt suficiente pentru a trece de la un cuvânt cod valid la un alt cuvânt cod valid Un astfel de cod poate fi folosit pentru a detecta erori individuale Dacă un cuvânt cu paritate incorectă este citit din memorie, este semnalată o eroare Programul nu va putea rula, dar nu va produce rezultate incorecte Ca exemplu simplu de cod de corectare a erorilor, luați în considerare un cod cu patru cuvinte de cod valide: , , și Intervalul Hamming pentru acest cod este , ceea ce înseamnă că poate corecta erori duble Dacă apare cuvântul de cod , computerul știe că inițial cuvântul arăta ca (presupunând că nu au apărut mai mult de două erori) Dacă apar trei erori (de exemplu, cuvântul se schimbă în ), această metodă nu este potrivită Imaginați-vă că vrem să dezvoltăm un cod care să aibă m biți de date și r biți de verificare, astfel încât toate erorile pe un singur bit să poată fi corectate Fiecare dintre cele milioane de cuvinte valide are n cuvinte de cod nevalide care diferă de cele valide unul câte un bit Ele sunt formate prin inversarea fiecăruia dintre cei n biți din cuvântul de cod de n biți Prin urmare, fiecare dintre cele m de cuvinte valide necesită n + combinații posibile de biți alocați acestui cuvânt (n opțiuni posibile eronate și una corectă) Deoarece numărul total de combinații diferite de biți este ", atunci (n + ) m < " Deoarece n = m + r, memoria principala atunci (m + r + ) < r Această formulă oferă o limită inferioară a numărului de biți de paritate necesari pentru corectarea erorilor individuale În tabel arată numărul necesar de cifre de verificare pentru cuvinte de diferite dimensiuni Tabelul Numărul de biți de verificare pentru cod capabil să corecteze erori individuale Dimensiunea cuvântului sursă Număr de biți de verificare Dimensiunea totală a cuvântului Procentul de creștere a cuvintelor Această limită inferioară teoretică poate fi atinsă folosind metoda lui Richard Hamming [ ] Dar înainte de a trece la acest algoritm, să ne uităm la o diagramă grafică simplă care ilustrează clar ideea de cod de corectare a erorilor pentru cuvintele pe biți Diagrama Venn din fig conține cercuri, A, B și C, care formează împreună șapte sectoare Să codificăm, ca exemplu, un cuvânt de biți în sectoarele AB, ABC, AC și BC, câte un bit pe sector (în ordine alfabetică) O astfel de codificare este ilustrată în Fig , a Orez Numărul de codificare (a); se adaugă biți de paritate (b); eroare sector AC (c) Apoi, adăugăm un bit de paritate la fiecare dintre cele trei sectoare goale, astfel încât suma biților din fiecare dintre cele trei cercuri, A, B și C, să fie pară, așa cum se arată în Fig , b În cercul A există numere: , , și , care împreună dau un număr par În cercul B sunt numerele , , și , care se adună și ele la un număr par A similar situație pentru cercul C În acest exemplu, s-a dovedit că toate sumele sunt aceleași, dar în general sunt posibile sume de și Modelul corespunde unui cuvânt de cod format din biți de date și biți de paritate Capitolul Organizarea sistemelor informatice Să presupunem că bitul din sectorul AC sa schimbat de la la , așa cum se arată în Fig , c Calculatorul detectează că cercurile A și C sunt impare Singura modalitate de a corecta eroarea prin schimbarea unui singur bit este de a returna valoarea la bitul din sectorul AC În acest fel, computerul poate corecta automat erorile individuale Acum să vedem cum algoritmul Hamming poate fi folosit pentru a genera coduri de corectare a erorilor pentru cuvinte de orice dimensiune În codul Hamming, r biți de paritate sunt adăugați unui cuvânt format din m biți, formând astfel un cuvânt de lungime m + r biți Biții sunt numerotați de la unu (în loc de zero), cu cel din stânga considerat primul Toți biții ale căror numere sunt puteri de doi sunt biți de paritate; restul sunt folosite pentru date De exemplu, la un cuvânt de biți trebuie adăugați biți de paritate Biții numerotați , , , și sunt biți de paritate, restul sunt biți de date Un cuvânt conține de biți ( biți de date și biți de paritate) În acest exemplu, vom folosi o verificare de paritate (alegere arbitrară) Fiecare bit de paritate vă permite să verificați anumite poziții ale biților Numărul total de biți cu valoarea în pozițiile verificate trebuie să fie par Următoarele sunt pozițiile de verificare pentru fiecare bit de paritate: + bitul verifică biții , , , , , AND, , , , , ; ♦ bitul verifică biții , , , , , AND, , , , ; ♦ bitul verifică biții , , , , , , , , , ; ♦ bitul verifică biții , , , AND, , , , ; ♦ bitul verifică biții , , , , , În general, bitul b este verificat de biții b h l fy, astfel încât bx + b + + + bj = b De exemplu, bitul este verificat de biții și deoarece + = Bitul este verificat de biții și deoarece + = și așa mai departe Figura ilustrează construcția unui cod Hamming pentru cuvântul de biți Cuvântul de cod de de biți corespunzător este Pentru a înțelege cum funcționează corectarea erorilor, luați în considerare ce se întâmplă dacă bitul își schimbă valoarea (de exemplu, din cauza unei supratensiuni) ) Ca urmare, în loc de cuvântul de cod , se va obține Se vor verifica biți de paritate Iată rezultatele: ♦ bitul de paritate greșit (biții , , , , , AND, , , , , conțin cinci); ♦ bitul de paritate corectă (biții , , , , , , , , , conțin șase); ♦ bitul de paritate greșit (biții , , , , , , , , , conțin cinci); ♦ bitul de paritate corectă (biții , , , AND, , , , conțin doi); ♦ paritate corectă bitul (biții , , , , , conțin patru) memoria principala Numărul total de din biții , , , , , AND, , , , și trebuie să fie par, deoarece paritatea este utilizată în acest caz Unul dintre biții verificați de bitul de paritate (și anume , , , , , AND, , , , și ) trebuie să fie incorect De asemenea, bitul de paritate este incorect Aceasta înseamnă că unul dintre următorii biți a schimbat valoarea: , , , , , , , , , Eroarea trebuie să fie într-un bit care este conținut în ambele liste În acest caz, sunt comuni biții , , , și Deoarece bitul de paritate este corect, biții și sunt excluși Corectitudinea bitului de paritate elimină prezența unei erori în bitul În cele din urmă, bitul este de asemenea exclus, deoarece bitul de paritate este corect Ca urmare, rămâne bitul , în care se află eroarea Deoarece acest bit este setat la , ar trebui să fie setat la Așa sunt corectate erorile Cuvântul în memorie L ±±J L L[Î] L L LA paritate Orez Construirea codului Hamming pentru cuvântul prin adăugarea a cinci biți de verificare la biții de date Pentru a găsi bitul greșit, mai întâi trebuie să numărați toți biții de paritate Dacă sunt corecte, nu există nicio eroare (sau există, dar eroarea nu este una singură) Dacă sunt găsiți biți de paritate greșiți, trebuie să adăugați numerele acestora Suma rezultată va da numărul de poziție al bitului greșit De exemplu, dacă biții de paritate și sunt greșiți și , și sunt corecti, atunci a apărut o eroare în bitul ( + ) Cache Procesoarele au fost întotdeauna mai rapide decât memoria Pe măsură ce procesoarele și memoria evoluează în paralel, această discrepanță persistă Pe măsură ce tot mai mulți tranzistori pot fi plasați pe un cip, designerii de procesoare creează arhitecturi pipeline și superscalare pentru a crește și mai mult viteza procesoarelor Designerii de memorie tind să folosească noile tehnologii pentru a crește capacitatea mai degrabă decât performanța, ceea ce face decalajul și mai mare În practică, această discrepanță de viteză are ca rezultat faptul că atunci când procesorul accesează memorie, este nevoie de mai multe cicluri de mașină înainte de a primi cuvântul solicitat Cu cât memoria rulează mai încet, cu atât procesorul trebuie să aștepte mai mult, cu atât este nevoie de mai multe cicluri După cum am menționat deja, există două moduri de a rezolva problema Cel mai simplu dintre acestea este să începeți să citiți informații din memorie în timp ce continuați să executați comenzi, dar dacă vreo comandă încearcă să folosească un cuvânt înainte Capitolul Organizarea sistemelor informatice pe măsură ce este citit din memorie, procesorul ar trebui să se suspende Cu cât memoria rulează mai lent, cu atât mai des va apărea această situație și cu atât timpul de inactivitate al procesorului va fi mai lung De exemplu, dacă întârzierea este de cicluri, este foarte probabil ca una dintre următoarele instrucțiuni să încerce să folosească un cuvânt care nu a fost încă citit din memorie O altă soluție la problemă este să proiectați o mașină care nu se întrerupe, dar se asigură că programele de compilare nu folosesc cuvinte înainte de a fi citite din memorie Cu toate acestea, acest lucru nu este atât de ușor de implementat în practică Adesea, atunci când procesează o comandă de încărcare, mașina nu poate efectua alte acțiuni, astfel încât compilatorul este forțat să introducă comenzi goale care nu fac altceva decât să ocupe spațiu de memorie În realitate, cu această abordare, nu hardware-ul este inactiv, ci software-ul, dar degradarea performanței este aceeași De fapt, această problemă nu este tehnologică, ci economică Inginerii știu cum să creeze memorie care rulează la fel de rapid ca un procesor Cu toate acestea, trebuie plasat direct pe cipul procesorului (deoarece informația prin magistrală este foarte lentă) Punerea multă memorie pe un cip de procesor îl face mai mare și, prin urmare, mai scump și, chiar dacă costul nu a contat, există totuși limite pentru dimensiunea procesoarelor care pot fi construite Astfel, trebuie să alegeți între memorie rapidă, mică și memorie lentă și mare (Desigur, am prefera să avem o memorie rapidă, mare și, de asemenea, ieftină ) Este interesant de observat că există tehnologii 